はじめまして、ではないんですが(苦笑)ちょっとMS系文字コードについて幾つか質問
(相談?)したいことがあって書き込みします。よろしくお願いします。
WindowsにおけるCP932とBruno氏のlibiconvにおける定義がズレているのは承知してい
ます。森山さんのlibiconvパッチのうち、CP932とUCSとの変換の実際の動作について
は、実に納得しています。2002年の[sugj-tech]を仲介としたBruno氏とのやりとりで、
一定の理解を得られているところまでは確認しました。にも関わらず、現在に至るまで
その部分に関してlibiconv本家には反映されていませんね。何か、その後に変更を拒否
されるようなやり取りがあったのでしょうか? それとも単にパッチを送っていないため
にBruno氏としても手が出せない、ということなのでしょうか?
次にいわゆるEUCとJISの問題です。これについては何が正しいとか、どうすべきか明確
なビジョンを私はまだ持てていないのですが、MS系文字コードとの変換用にとeucJP-ms
を定義しサポートするというのは妥当だと思っています。となれば当然JISに相当する
MS系エンコードもサポートされてしかるべきでしょうね。ただそうなってくると、OSと
のロケール指定の関係から、やや面倒なことになるんじゃないかなぁという気もしてい
るんです。
というのも日本での使用では、結局のところどうしたってWindowsのCP932との変換がメ
インになってしまうのですから、libiconv本家に統合しないのならば、euc-jpを
eucJP-msと同じ定義にしてしまったほうが余計な混乱はないんじゃないか、そんな誘惑
にも駆られます。実際に自家使用しているiconvはそうしてます(苦笑)。逆にちゃんと
eucJP-msをIANAに登録されるまで持っていく、というのもありだと思うんですが、現状
がどうなっているのか、(まったく0の場合)そうするにはどういうプロセスが必要なの
か、まったく見通しが立たないんですね。
ちょっと散漫になってしまいましたが、私の目的は非常に単純で「libiconvのようなデ
ファクトスタンダードなライブラリに、日本語コードの実情に即した変換ができるよ
う、本家のレベルで実装させたい」ということなのです。その際、できればライブラリ
の利用者に負担や誤解の少ない方法であればベストだと考えますが、それは努力目標と
いうところです(^-^;。で、この目標に対して、何か森山さんの思うところがあればお
聞かせ願いたい次第です。
興味がありましたら、お時間のある時で結構ですので、お考えをお聞かせください。