SSブログ

波ダッシュと全角チルダ(2) [ソフトウェア/PC関係]

昨日の「~(波ダッシュ)」の話の続き。PerlのEncodeモジュールを使って,utf8/Shift JIS間のコード変換を試してみたところ,若干の勘違いがあった。

結論から言えば,Unicodeの波ダッシュ(U+301C)を,'cp932'で変換すると「?」になってしまい,'shift jis'で変換すると「~(0x8160)」になる。一方,Unicodeの全角チルダ(U+FF5E)を,'cp932'で変換すると「~」になり,'shift jis'で変換すると「?」になる。昨日書いたことと逆だ。これはつまり,正規のJIS(Shift JIS)の文字定義に従えば,「波ダッシュ」が「波ダッシュ」に変換されるのが当たり前で,Microsoftのcp932の場合には,変則的に「全角チルダ」を「波ダッシュ」に変換する,ということなのだろう。いずれにしても,逆変換のことも考えられているのか,「波ダッシュ」と「全角チルダ」を,両方ともJISの「波ダッシュ」にするコード変換はないようだ。

となると,WindowsとMacの「~」が混在するデータを,どうコード変換すべきなのだろう...って,あらかじめ,どっちかの「~」をもう片方に置換しておけばいいだけじゃん...という,あまりに単純なことに気付いて,自分にがっかりしてしまった...。

さて,これで一件落着...と思いきや,Shift JISに変換後のデータをチェックしていたら,やはり変なところに「?」が。元データを確認してみると,対応するのは「ハート」。ハートって,JISには定義されていないのか...。こればかりは,対応する文字が定義されていないのだから,どうしようもありませんな。

このWebの時代,Shift JISに変換して処理しよう,っていうのがそもそも時代遅れなことのような気もしてきた。実際,友人とのチャットの中では,日本語以外の文字を使ったりもしているし...。Shift JISに拘っているのは,未だにWZ Editor 3.0をメインに使い続けているからなんだよね。やっぱり,Unicodeをちゃんと扱えるエディタに,そろそろ移行すべきなんだろうか。WZ Editor 3.0が出たのは1997年4月。かれこれ15年も使い続けてきた訳だ。操作が完全に指に染みついてしまっていて,考えるより先に指が動く状態。そろそろ潮時だろうと,理屈では分かっていても,なかなか踏み切れない...。


nice!(0)  コメント(0)  トラックバック(0) 

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

※ブログオーナーが承認したコメントのみ表示されます。

トラックバック 0

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。