2004年11月06日(土) [過去の今日]
#1 辞書
いろいろやらなきゃならないことがあるのだが、思いきり逃避してCannaの辞書を整理。念願だった郵政公社の郵便番号データから、そこそこ使える形で地名辞書を生成することに成功した。他、固有名詞辞書を整理しまくり。
ただ、ドキュメントに無い品詞を見付けてしまって再整理の必要を感じる今日この頃。さてはて、どうしたものか。
(@209)
#2 EPWING辞書の圧縮
圧縮ファイルシステムを利用してマウントすることになるのかなあと思ってたのだが、debianパッケージのeb-utilsにebzipというコマンドがあることを知った。こいつで辞書を圧縮できるようだ。
おかげで1G以上あったものが700M程度にまで収まった。大体半分くらいになるようだ。emacsのlookupをndeb(eblook)で利用してるのだが、そのまま圧縮された辞書を読んでくれる。これはありがたい。
(@839)