本パッチは libiconv-1.8 の cp932 を修正します。そして、eucJP-ms と cp50220 を追加します。
本パッチで、iso-2022-jp は修正されません。
JIS とMS のエンコーディングを分離する事を目的とします。
各エンコーディングは、次のような直交関係があります。
CES | JIS系エンコーディング | MS系エンコーディング |
---|---|---|
シフトJIS | sjis | cp932 (Microsoft) |
EUC | euc-jp | eucJP-ms (TOG/JVC) |
RFC1468 | iso-2022-jp | cp50220 (Microsoft) |
これにより、WAVE DASH と FULLWIDTH TILDE 等の違いを気にせずに、cp932 に対して CES (Character Encoding Scheme) の変換を行う事が可能となります。
libiconv-1.8-cp932-family.diff.gz
$ tar zxvf libiconv-1.8.tar.gz $ zcat libiconv-1.8-cp932-family.diff.gz | patch -p0
$ cd libiconv-1.8 $ ./configure $ make ; make check $ su # make install
他に環境によっては /etc/ld.so.conf に /usr/local/lib を追加し ldconfig -v (/sbin/ldconfig -v) を実行しておく必要があるでしょう。
$ iconv -l | egrep -i '(-31j|-ms|cp5)' EUCJP-MS EUCJP-OPEN EUCJP-OPEN-19970715-MS EUCJP-WIN CP932 MS932 SJIS-CP932 SJIS-OPEN SJIS-WIN WINDOWS-31J CP50220 ISO2022JP-CP932 $
作成中 (round trip 可能なコードポイントの変換は libiconv-1.8-cp932-patch.diff.gz と完全に一致します。)
作成中 (round trip 可能なコードポイントの変換は libiconv-1.8-cp932-patch.diff.gz と完全に一致します。)
Windows のコードページ 50220 に相当するもので、コードページ 932 (Windows-31J) を RFC1468(ISO-2022-JP) 符号化方式にしたものになります。
※このエンコーディングでは、ユーザー定義文字は扱えません。
文字集合
エスケープシーケンス・制御コード
Unicode との変換規則