文字コード掲示板


記事表示


No.180投稿日時:2004/07/15(木) 12:28    <↑親記事:No.176>
投稿者:森山 将之  <E-Mail>

libiconv-1.9.1-cp932-family.patch ?

もし libiconv-1.9.1 用にも cp932-family パッチが欲しいという事であれば、作成いたします。

ただ、個人的には、cp50220 は半角カナを勝手に全角のカタカナに変換してしまうだとか、ユーザー定義文字を変換できないだとか純粋にエンコーディング変換としてみた場合、ちょっと使いづらいなと感じています。
TR X 0015:1999 XML日本語プロファイル x-iso2022jp-cp932 にしても、Unicode経由での「〜」等の変換の問題を解決するためだけのもので、文字集合の制限がきつくて、忠実に実装すると、機種依存文字を使えないものとなってしまいます。
で、新しい charset 名を考えて、勝手に実装をしてしまうかとも考えていたりします。

たとえば、x-iso-2022-windows-932 で

G0 集合のみを使い

機種依存文字に関しては、IBM拡張文字→NEC選定IBM拡張文字の変換をしてから ESC $ B
JIS X 0201 片仮名は ESC ( I
ユーザー定義文字は ESC $ ( ? ← JIS X 0202 の 「13.3.3 私用」の定義による

などのエスケープシーケンスを使うとか。

※JIS X 0202 は、http://www.jisc.go.jp/ の JIS検索でPDFにより『閲覧』が可能です。


Script : Sylpheed 1.24
Modified by MORIYAMA Masayuki