| No.088 | 投稿日時: | 2003/08/22(金) 21:39 <親記事> |
| 投稿者: | 森山 将之 |
ここ 2,3 日、掲示板の CGI で、アクセスログを取るようにしていたのですが、
Google などで Cp943C について調べている人が多いようでしたので、あまり役
に立たないかもしれませんが、私が調べてたどりついたページなどを紹介してお
きます。
サポートされているエンコーディング
http://java.sun.com/j2se/1.3/ja/docs/ja/guide/intl/encoding.doc.html
> Cp943C | Cp943 の拡張
インストール関連情報 Hints&Tips
http://www-6.ibm.com/jp/pspjinfo/os2/hints/128.html
> コードページ 943 について
> コードページ 943 (以下 CP943) は OS/2 Warp 4 で新たに導入された新JIS並び
> 専用のコードページです。 CP943は特にマルチ・ベンダー、マルチ・プラット
> フォーム環境のためにデザインされたコードページです。 詳しい説明は「日本語
> 版ご使用の手引き」参照してください。
> CP943 は新しいコードページのため、CP943 が定義される以前に作られたアプリ
> ケーションは動作しない場合があります。 このため、既存のアプリケーション
> を使用する場合には、事前にそのアプリケーションが CP943 をサポートしてい
> るか確認してください。確認ができない場合、CP943 は選択しないでください。
Java Cp943 と Unicode との変換表
http://oss.software.ibm.com/cvs/icu/charset/data/ucm/java-Cp943-1.2.2.ucm
Java Cp943C と Unicode との変換表
http://oss.software.ibm.com/cvs/icu/charset/data/ucm/java-Cp943C-1.3_P.ucm
Java MS932 と Unicode との変換表
http://oss.software.ibm.com/cvs/icu/charset/data/ucm/java-MS932-1.3_P.ucm
※2003/08/26 追記:上記変換表には、NEC選定IBM拡張文字など、エンコーディング
→Unicode の片方向変換のみのマッピングは省略されているようです。
変換表の |0 などの意味
|0 エンコーディング ⇔ Unicode 双方向の変換が可能 (round trip 可)
|1 Unicode → エンコーディング の片方向変換のみ
|3 エンコーディング → Unicode の片方向変換のみ
Unicode での文字割り当てを調べる場合は、次のページで調べる事ができます。
http://www.unicode.org/charts/unihan.html
| No.089 | 投稿日時: | 2003/08/24(日) 02:14 <↑親記事:No.088> |
| 投稿者: | 近藤 <E-Mail> |
2003/08/05にNo.083「UTF-8の文字コード表について」を質問した近藤です。
> Unicode での文字割り当てを調べる場合は、次のページで調べる事ができます。
> http://www.unicode.org/charts/unihan.html
私の質問の中で
>UnicodeまたはUCS-4の文字コード表でも結構です。
と書きましたが、上記のURLの中身が
私が欲しかった「Unicodeの文字コード表」です。
(083では080で森山さんが使われた”Windowsの「文字コード表」・・・”
という表現から言葉を選んだつもりでしたが、
今読み返すと分かりにくいですね。すみませんでした。)
いずれにしても、ありがとうございました。
| No.092 | 投稿日時: | 2003/08/26(火) 23:18 <↑親記事:No.088> |
| 投稿者: | 森山 将之 |
> Java Cp943 と Unicode との変換表
> http://oss.software.ibm.com/cvs/icu/charset/data/ucm/java-Cp943-1.2.2.ucm
> Java Cp943C と Unicode との変換表
> http://oss.software.ibm.com/cvs/icu/charset/data/ucm/java-Cp943C-1.3_P.ucm
> Java MS932 と Unicode との変換表
> http://oss.software.ibm.com/cvs/icu/charset/data/ucm/java-MS932-1.3_P.ucm
元記事にも追記で書きましたが、上記変換表は実際のマッピングから省略されている
ものがあるようです。
厳密な変換表が必要な場合には、実際に Java で変換させて調べるなどした方がよさ
そうです。