2004年11月10日(水) [過去の今日]
#1 美紗緒辞書
shionベースの美紗緒辞書1.0βが完成。以前のバージョン0.0よりだいぶ賢くなってるはず。特にsuffix辞書を利用した場合の変な変換が無くなるように調整。しかし、今回の売りは記号辞書と地名辞書。JIS2000で規定されたものまではまだ収録してないが、旧来より使われて来た全角記号文字が出しやすくなってる。「@あるふぁ」→「α」という感じでさくさく変換できる。地名辞書は郵政省が公開してる郵便番号辞書から生成したものに加え、外国地名を500語以上収録。冬までの間に実際に使用してテストし、微調整して巫女ぐにょに収録&単体リリースが目標かな。
しかし、mkdic -fq して学習データをリセットしないと、辞書がマウントできないことがあるのはなぜだろう。よくわからんなあ。
(@429)