文字コード掲示板


一括購読


No.088投稿日時:2003/08/22(金) 21:39    <親記事>
投稿者:森山 将之

Cp943C を調べる際の参考に

ここ 2,3 日、掲示板の CGI で、アクセスログを取るようにしていたのですが、
Google などで Cp943C について調べている人が多いようでしたので、あまり役
に立たないかもしれませんが、私が調べてたどりついたページなどを紹介してお
きます。

サポートされているエンコーディング
http://java.sun.com/j2se/1.3/ja/docs/ja/guide/intl/encoding.doc.html
> Cp943C | Cp943 の拡張

インストール関連情報 Hints&Tips
http://www-6.ibm.com/jp/pspjinfo/os2/hints/128.html
> コードページ 943 について
> コードページ 943 (以下 CP943) は OS/2 Warp 4 で新たに導入された新JIS並び
> 専用のコードページです。 CP943は特にマルチ・ベンダー、マルチ・プラット
> フォーム環境のためにデザインされたコードページです。 詳しい説明は「日本語
> 版ご使用の手引き」参照してください。
> CP943 は新しいコードページのため、CP943 が定義される以前に作られたアプリ
> ケーションは動作しない場合があります。 このため、既存のアプリケーション
> を使用する場合には、事前にそのアプリケーションが CP943 をサポートしてい
> るか確認してください。確認ができない場合、CP943 は選択しないでください。

Java Cp943 と Unicode との変換表
http://oss.software.ibm.com/cvs/icu/charset/data/ucm/java-Cp943-1.2.2.ucm
Java Cp943C と Unicode との変換表
http://oss.software.ibm.com/cvs/icu/charset/data/ucm/java-Cp943C-1.3_P.ucm
Java MS932 と Unicode との変換表
http://oss.software.ibm.com/cvs/icu/charset/data/ucm/java-MS932-1.3_P.ucm

※2003/08/26 追記:上記変換表には、NEC選定IBM拡張文字など、エンコーディング
→Unicode の片方向変換のみのマッピングは省略されているようです。

変換表の |0 などの意味
 |0 エンコーディング ⇔ Unicode 双方向の変換が可能 (round trip 可)
 |1 Unicode → エンコーディング の片方向変換のみ
 |3 エンコーディング → Unicode の片方向変換のみ

Unicode での文字割り当てを調べる場合は、次のページで調べる事ができます。
http://www.unicode.org/charts/unihan.html


No.089投稿日時:2003/08/24(日) 02:14    <↑親記事:No.088>
投稿者:近藤  <E-Mail>

2003/08/05にNo.083「UTF-8の文字コード表について」を質問した近藤です。

> Unicode での文字割り当てを調べる場合は、次のページで調べる事ができます。
> http://www.unicode.org/charts/unihan.html

私の質問の中で
>UnicodeまたはUCS-4の文字コード表でも結構です。
と書きましたが、上記のURLの中身が
私が欲しかった「Unicodeの文字コード表」です。

(083では080で森山さんが使われた”Windowsの「文字コード表」・・・”
 という表現から言葉を選んだつもりでしたが、
 今読み返すと分かりにくいですね。すみませんでした。)

いずれにしても、ありがとうございました。


No.092投稿日時:2003/08/26(火) 23:18    <↑親記事:No.088>
投稿者:森山 将之

ICU の変換表は不完全?

> Java Cp943 と Unicode との変換表
> http://oss.software.ibm.com/cvs/icu/charset/data/ucm/java-Cp943-1.2.2.ucm
> Java Cp943C と Unicode との変換表
> http://oss.software.ibm.com/cvs/icu/charset/data/ucm/java-Cp943C-1.3_P.ucm
> Java MS932 と Unicode との変換表
> http://oss.software.ibm.com/cvs/icu/charset/data/ucm/java-MS932-1.3_P.ucm

元記事にも追記で書きましたが、上記変換表は実際のマッピングから省略されている
ものがあるようです。

厳密な変換表が必要な場合には、実際に Java で変換させて調べるなどした方がよさ
そうです。


Script : Sylpheed 1.24
Modified by MORIYAMA Masayuki