文字コード掲示板


記事表示


No.026投稿日時:2002/10/22(火) 02:59    <親記事>
投稿者:森山 将之

Encode 1.79 リリース (Perl5.8.0)

Encode 1.79 がリリースされました。

Encode モジュールは、Perl 5.8.0 で、Unicode と Shift_JIS などの既存の文字コード (エンコーディング) との変換を行うモジュールで、Perl 5.8.0 では、Unicode サポートの強化により、一旦 Unicode に変換して処理させる事でシフトの 2バイト目の 0x5C 問題などに煩わされずに日本語の処理が可能となっています。

Perl 5.8.0 に標準で付いてくる Encode 1.75 では Windows のコードページ932 (マイクソロソフトが Shift_JIS に NEC特殊文字やIBM拡張漢字等を追加したもの) の変換をする cp932 の変換に一部問題がありましたが、Encode 1.79 で完全にその問題が解消されました。

一番大きな問題点は、JIS文字の ∪∩¬∠⊥≡≒√∵∫ が Unicode へ変換出来きず、逆に、Unicode の該当文字が、機種依存文字に変換されてしまうという問題でした。

それに付随して次のページで説明してある変換とは異なる変換をしている、もしくは変換できない文字がありましたが、Encode 1.79 では、それらすべてが解消されています。

http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/uni2sjis.html

※同時に、日本語の文字コード以外の cp936(簡体字中国語:GBK), cp949(韓国語:UHC), cp950(繁体字中国語:Big5) の変換も、マイクロソフトの Windows での変換と同じになるように修正されました。

Perl 5.8.0 をお使いの方は、Encode モジュールを最新バージョンにアップデートされる事をお勧めします。

http://www.cpan.org/ にアップロードされいます。


Script : Sylpheed 1.24
Modified by MORIYAMA Masayuki