2006年07月11日(火) [過去の今日]
いろいろと参考になるURIなどもあるので一読の価値あり。
あんまり文字コード問題には詳しい方じゃないのだが、よく使われてるUTF-8ってのはUnicode 2.0で、すでに100万文字が扱える体系なのね。んで、Unicode 3.0では異体字タグや言語タグがつくってことか。
ふーん、なるほど。ということはまだ言語タグがないので、今EUC-JPやiso-2022-jpからUTF-8にしちゃうと、文字コード中に言語タグが付かず、後々人間が判定してタグを入れてやらなきゃならないってことになるのかな。
だとするとめんどくさいなあ。
(@205)