文字コード掲示板


記事表示


No.051投稿日時:2003/03/27(木) 01:55    <↑親記事:No.050>
投稿者:森山 将之

C0集合とC1集合

> http://czyborra.com/charsets/codepages.html
> をみるとCP437(アメリカ)は適当な罫線素片などを入れているようですが、
> それを適当に再配置したんでしょうか、、。

上記文字コード表を見るとシフトJIS のいわゆる半角カナで使用されている領域に
罫線文字が割り当てられているので、CP932 ではバッティングしない位置に再配置
したのでしょうね。
これらの文字は海外のソフトを日本語化する際に必要だったのかもしれません。

> http://www.microsoft.com/globaldev/reference/dbcs/932.htm
> には ISO6429互換の制御文字(というか、制御文字の名前)が
> 決められているだけのようですが、、。

本来、0x00〜0x1F (C0集合) と 0x80〜0x9F (C1集合) は制御コードの領域で、
図形文字の領域としては用いられない領域です。C0集合、C1集合に定義されてい
る文字はベンダで独自に定義した文字やシフトJISのエンコードで用いられてい
ますが、そもそもは規格外のものです。シフトJIS は、JIS X 0208:1997 で追認
されましたが、ISO/IEC 2022 (JIS X 0202) に則っていないので、毛嫌いして
いる人もいる事は確かです。

どういう理由で調べているのかわかりませんが、1バイト罫線文字は、いわゆる
「機種依存文字」だと考えておけば良いのではないでしょうか?


Script : Sylpheed 1.24
Modified by MORIYAMA Masayuki