文字コード掲示板


記事表示


No.068投稿日時:2003/05/18(日) 02:15    <親記事>
投稿者:森山 将之

PostgreSQL の EUC_JP は eucJP-open

なおかつ、Unicode との変換は、eucJP-ms となっているようです。
PostgreSQL に、EUC-JP でアクセスする場合は、この点に注意する必要があるよう
です。

eucJP-ms の変換は、次のページに書いたものと同じようです。(ポイントとなる部
分のみチェック)
http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/eucJP-ms.html

Windows用のブラウザが EUC-JP で送信する場合は、コードページ 51932 と呼ばれ
る、NEC選定IBM拡張文字を使い、EUC の 3 バイトコードを使わないエンコーディ
ングになります。これは、いわゆる機種依存文字部分やユーザー定義外字について
eucJP-open とは互換性が無いため、CGI で PostgreSQL にアクセスしていて、エ
ンコーディングは EUC-JP を用いている場合には注意が必要となるかもしれません。

あと、データベースのエンコーディングを UNICODE とし、ClientEncoding を
SJIS とした場合は、Java の MS932 とほぼ等価のようですが、ユーザー定義外字
の変換をサポートしていないとか、厳密には大文字のローマ数字等の変換が、
Cp943C と同じになっているようです。(PostgreSQL 7.3 で確認)

PostgreSQL 初心者なものなので、文字コードまわりのチェックをしただけですが…


Script : Sylpheed 1.24
Modified by MORIYAMA Masayuki