感想一覧

▽感想を書く
来生ナオ 様

ぱっと見て思い付いたのですが、漢数字変換はルールが複雑過ぎるので、
ひとまず来生様が使いやすいような形での「多段変換」が良いんじゃないですかね。

多段というか、候補リスト抽出→人間の目でざっと見て、その結果で単純な機械的変換。

漢数字なんてそんな頻繁に出てこないので、一旦漢数字近辺だけ抽出して表示、
その後チェックボックスでオンになってるやつだけを変換的な。
※取り敢えずチェック全部オンオフのボタンとか、行数表示や前後のわずかな文章表示とか、人間が確認作業しやすくするUIの工夫はおいといて。

多少動的なページといえばそうですけど……DOMでtableの行(tr/td)なりdivなりを増やしてくだけかと。
どうしても動的が大変、無理なら、別のテキストエリアに書き出して、行の先頭文字をフラグか何かで、また実際の変換時に中身解析して…ってそっちの方が超面倒そうですけど(^-^;

変換後の候補も、テキストを手で微修正出来るようにしとけば、ゼロと零とかもまぁ好みで対応できるのでは。
あと一般、とか、一生、とか一旦、とかの頻出語は候補に上げる除外リストに入れといて。
(候補除外リストも何かカスタマイズとか手修正できるようにとか)

イメージ伝わらなかったら済みません。適当な思い付きです。

私は多分使うことないので……参考までに!
  • 投稿者: KC
  • 2025年 12月31日 04時31分
多分使うことがないのに、こんなに考えてくださってありがとうございます!
変換候補を抽出して選ばせる、というのは私にはなかったアプローチでした。誤変換を減らすにはどうすればいいだろう、というのは色々と悩んでいたのですが、ユーザ自身が選択すれば確かに誤変換はなくなりますね。
とても参考になりました!このまま採用させていただくかもしれないです!
面白いしすごいです。
私個人は横書きで考える人なので横→縦の方を使う機会があるかもしれません。
アイヌ語や鼻濁音の「あ゜」「か゜」みたいな文字は単独の文字が規定されていないので、2文字組み合わせるかUnicodeの合成用濁点/半濁点を使うかになるのですが、MS Word上でテキストの方向を変更するとUnicodeでも見事に崩れた経験があります。サブカル畑でも言語学でも使えそうです。
  • 投稿者: xoo
  • 2025年 12月30日 23時22分
コメントありがとうございます!
Unicodeには合成用濁点とかがあるのですね。自分が2文字組み合わせしか使わないので、まったく意識していませんでした。
小説文に限らず、縦書きと横書きの変換で表記が崩れやすい文章を書く分野は確かにありそうです。そういった用途にも使える可能性がある、という視点はとても参考になりました。
↑ページトップへ