toinamiの日記β このページをアンテナに追加 RSSフィード

2007-05-13 (Sun)

[]JIS X 0213対応文字コード変換ルールになっている?(追記有り) 22:29 JIS X 0213対応文字コード変換ルールになっている?(追記有り) - toinamiの日記β を含むブックマーク はてなブックマーク - JIS X 0213対応文字コード変換ルールになっている?(追記有り) - toinamiの日記β JIS X 0213対応文字コード変換ルールになっている?(追記有り) - toinamiの日記β のブックマークコメント

機種依存文字などが文字化けする系の問題。

idea:15181の確認。



「ⅰ」は、Windows上では(Shift_JISで)2種類のコードで表すことができるけど、そのうちの一方は0xEEEF。

JISコードが7C71になっているけど、もちろん本来のJIS X 0208には存在しない。機種依存だから)

f:id:toinami:20070513221559p:image

(参考1:ATOK2006での文字コード表示画面)


以下はWindows XP + Firefox 2.0.0.3で確認

Wikipediaらへんから、ダイアリの編集画面に貼り付けて、確認

f:id:toinami:20070513221732p:imageWikipedia

f:id:toinami:20070513221751p:image(ダイアリ編集画面

f:id:toinami:20070513221809p:image(ダイアリ確認画面)

文字化けする。

「i」から変更された文字は「鄯(鄯)」(U+912F)。



JIS X 0213 附属書6の、191ページ目に該当の漢字あり。(JISの規格書のPDFだとX0213_09.pdfの53ページ目あたり)

f:id:toinami:20070513222310p:image

該当文字のSJISコード(文字の左下)は「eeef」で、cp932(WindowsでのShift_JIS)での「ⅰ」のコードと、JIS X 0213でのShift_JISコードが一致した(機種依存で振っていた仮のJISコード7C71と、JIS X 0213でのJISコード7C71が一致した)。

ダイアリ上では実際にはEUC-JPで処理は行っていたはずですが、どこかでUnicode変換を噛ますようにでもなったんでしょうか。その際の変換テーブルがJIS X 0213ルールに既に変わってしまっていて文字化け




Mac OS Xあたりなら問題は起きないんじゃないかという気はしますが、XP以前のWindowsユーザはちょっと問題のある場合もあるかも。ま、機種依存文字を使わない、と言うのが一番良いわけですが。(草彅、とか入れようとすると多分困る)

Vistaはどうなんだろうね。



機種依存文字使用キーワード」の一部のリンクも機能しなくなった。

追記

OSだけじゃなくブラウザにもよるかもしれない。

Windows XP + IE6だとちょっと化け方が違う。

ブラウザ側も何かしているのか?

一応余談的追記

JISの規格書の検索は http://www.jisc.go.jp/ から。

Javascript必要。

http://www.jisc.go.jp/app/JPS/JPSO0020.htmlに飛ばされて、3箇所入力可能なところがあるので、番号がわかっていれば一番上「JIS規格番号からJISを検索」欄に、(この場合JIS X 0213なので)「X0213」で検索。

閲覧専用ではあるものの、PDFの一覧画面にゆけるので必要なのを見てください。

閲覧専用なので大きな声では言えませんが、ブラウザの設定でPDFファイルブラウザ内で開かないようにしてダウンロードすると少しだけ幸せになれます。

トラックバック - http://beta.g.hatena.ne.jp/toinami/20070513