2007年02月09日(金) [過去の今日]
#2 混在文字コードなファイルシステム
うちのマシンは長年使い続けてるのもあるのだが、管理してる人間がアレなのでShift_JISとかの文字コードのファイル名がたまにまじっとる。UTF-8ロケールに移行するにも、変換がめんどうだ。
で、実際どれくらいあるのかと思って以下のようなワンライナーを走らせてみた。
$ locate . | perl -MEncode::Guess -ne 'my $dec = Encode::Guess->guess($_, qw/ascii euc-jp/); if(!ref $dec) { print $_; }'
……なんか300以上あるんですけど。
むう、どうすっかなあ、大半はShift_JISだと思うのだが、どうもiso-8859-1なファイル名もあるぽいな。そのまま変換してしまうにはディレクトリ名もあるようだし……。
convmvがEncode::Guess使ってくれれば楽なんだが、ソース見た限りそういう改造突っ込むのも厳しそうだな……。はあ、どうすっかな。
(@574)