| No.022 | 投稿日時: | 2002/09/28(土) 20:47 <親記事> |
| 投稿者: | 森山 将之 |
[Windows-31J と Unicode との文字コード変換]
http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/uni2sjis.html
というページを作成いたしました。
マイクロソフト Code Page 932 (Windows標準文字セット) の Unicode との文字コード変換時に、重複符号化されている文字をどのように変換しているのかという事を、簡単にまとめてみました。
Internet Explorer や EmEditor のように内部の文字コードが Unicode となっているアプリケーションソフトでは、上記変換が日常的に行われています。
Perl 5.8.0 に標準装備の Encode モジュールという既存の文字コードと Unicode 変換を行うモジュールに cp932 というのも入っているのですが、これは上記ページの動作とは異なるものでしたので、利用する場合には注意が必要です。
Encode モジュールの作者の方には、この件は報告してあります。