Anthyの変換精度を上げる方法
http://www.josw.net/blog/?p=1203
変完成度って…。
こんな感じで誤変換が多いAnthyですが、いつまでたっても頭が悪いままなのは、学習データをすぐ忘れちゃうかららしいです。
つまり、学習データの記憶容量が小さすぎて、覚えたことをどんどん忘れていってしまうみたいです。
実際、何時間も入力作業をしていると最初の方の結果は覚えてないし、すぐさま忘れるものもあります。
んで、これを解決するために、学習データの格納容量を大きくするっていうパッチがあるみたいなんですが、やはりパッチ当てるのも、その後自分で管理するのも面倒。
そのうえ、方法がやや複雑だったりデメリットもあるみたいです。
なので、良い方法無いかなーと考えたら、思いつきました。
学習データを格納する辞書ファイルを、行の削除が出来ないようにしてやればいいんだ、ということを。
つまり、追記のみ許可をしてあげるわけですね。
というわけで、やり方を書いておきます。
$ sudo chattr +a ~/.anthy/last-record2_default.utf8
いやまあ、多くの場合1行で済んじゃいます。最近のディストリビューション使ってるなら。
こうすると、Ext2,Ext3の機能でアクセス制御を行い、ファイルの追記のみを許可するということになります。
なので、Anthyが「これ忘れよう!」として学習データを削除しようとしても、削除できないということになります。
でも、教えられたことはどんどん覚えていくので、どんどん頭がよくなっていきます。
ちょっとDirty Hackな感じですが、変換効率は確実によくなっているので、試してみる価値はあると思いますよ。
ああ、もちろん自己責任ですからね。
まだ3日目なんで何とも言えませんが、不都合は起こってないので大丈夫だとは思います。
ご指摘があれば、コメントをお願い致しますね。
追記1
~/.anthy/last-record1_default.utf8
のほうなんですが、これの追記のみ許可はまだ試していません。
こっちもやると良くなるのかは、みなさんで試してみてください!
試した方は、結果の報告、ぜひお願いしますね!