| No.022 | 投稿日時: | 2002/09/28(土) 20:47 <親記事> |
| 投稿者: | 森山 将之 |
[Windows-31J と Unicode との文字コード変換]
http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/uni2sjis.html
というページを作成いたしました。
マイクロソフト Code Page 932 (Windows標準文字セット) の Unicode との文字コード変換時に、重複符号化されている文字をどのように変換しているのかという事を、簡単にまとめてみました。
Internet Explorer や EmEditor のように内部の文字コードが Unicode となっているアプリケーションソフトでは、上記変換が日常的に行われています。
Perl 5.8.0 に標準装備の Encode モジュールという既存の文字コードと Unicode 変換を行うモジュールに cp932 というのも入っているのですが、これは上記ページの動作とは異なるものでしたので、利用する場合には注意が必要です。
Encode モジュールの作者の方には、この件は報告してあります。
| No.025 | 投稿日時: | 2002/10/12(土) 16:27 <↑親記事:No.022> |
| 投稿者: | 森山 将之 <URL> |
タイトルを [Windows-31J の重複符号文字と Unicode] と変更しました。
また、トップページからのリンクは [Windows-31J 情報] へのリンクに変更し、その中のコンテンツとしました。
今のところ [Windows-31J 情報] には次の2つのコンテンツがあります。
・Windows-31J の文字セット
・Windows-31J の重複符号文字と Unicode
文字セットに関しては、「JIS X 0208 の 2区」、「NEC特殊文字(13区)」、「NEC選定IBM拡張文字(89〜92区)」、「IBM拡張文字(115〜119区)」を PNG画像として同一ページで閲覧としました