初めまして、近藤ともうします。
079と似た質問ですが、
UTF-8の文字コード表が
どこかのサイトにあればお教えください。
(Perlで自動的に作ることならできるのですが、
有効なコードと無効または未使用のコードの区別を知りたいのです。)
私がやりたいことは
ルビ付のshiftJISテキストを
PerlでHTMLに変換することです。
処理の都合で内部でUTF-8に変換していますが、
その状態で一文字ずつ漢字かどうかの判定をしたいのです。
「UCSとUnicode」のページ(http://www.d2.dion.ne.jp/~imady/charset/ucs.html)
を見ると
UnicodeまたはUCS-4とUTF-8の関係が説明されていますので
UnicodeまたはUCS-4の文字コード表でも結構です。
どなたかご存知でしたらよろしくお願いします。
| No.090 | 投稿日時: | 2003/08/24(日) 09:32 <↑親記事:No.083> |
| 投稿者: | 森山 将之 |
No.088 の内容で解決したようですが、以下の事をしたいのであれば、
CJK統合漢字 U+4E00〜U+9FFF かどうかをチェックするだけで良さそう
に思います。
> 私がやりたいことは
> ルビ付のshiftJISテキストを
> PerlでHTMLに変換することです。
> 処理の都合で内部でUTF-8に変換していますが、
> その状態で一文字ずつ漢字かどうかの判定をしたいのです。
■Unicode Home Page
http://www.unicode.org/
■関連JIS規格
JIS X 0208:1997 7ビット及び8ビットの2バイト情報交換用符号化漢字集合
http://www.webstore.jsa.or.jp/webstore/Com/FlowControl.jsp?lang=jp&bunsyoId=JIS+X+0208%3A1997&am...
JIS X 0221-1:2001 国際符号化文字集合(UCS) ― 第1部:体系及び基本多言語面
http://www.webstore.jsa.or.jp/webstore/Com/FlowControl.jsp?lang=jp&bunsyoId=JIS+X+0221-1%3A2001&...
■参考書籍
Unicode標準入門
http://www.seshop.com/detail.asp?pid=2276
JIS漢字字典
http://www.webstore.jsa.or.jp/lib/lib.asp?fn=/manual/mnl01_12.htm
| No.091 | 投稿日時: | 2003/08/25(月) 01:15 <↑親記事:No.090> |
| 投稿者: | 近藤 <E-Mail> |
> No.088 の内容で解決したようですが、以下の事をしたいのであれば、
> CJK統合漢字 U+4E00〜U+9FFF かどうかをチェックするだけで良さそう
> に思います。
>
> > 私がやりたいことは
> > ルビ付のshiftJISテキストを
> > PerlでHTMLに変換することです。
> > 処理の都合で内部でUTF-8に変換していますが、
> > その状態で一文字ずつ漢字かどうかの判定をしたいのです。
>
はい、そうします。
色々な参考URLもありがとうございました。
| No.110 | 投稿日時: | 2003/10/01(水) 02:57 <↑親記事:No.083> |
| 投稿者: | 近藤 <E-Mail> <URL> |
以前ここで、管理人さんからunicodeコンソーシアムのサイトを教えて頂いて
unicodeのcode chart(PDF version)を見つけましたが、
perlでコード版を作ってSJISでの有無で色分けもしました。
http://www.mywave.co.jp/~tknottet/UnicodeIndex.cgiにありますので
興味がありましたら一度見てください。
| No.111 | 投稿日時: | 2003/10/04(土) 19:00 <↑親記事:No.110> |
| 投稿者: | 森山 将之 |
インターネットを探してないものは、自分で作って公開するという事を多くの
人が実践していけば、インターネットでの情報も充実しくでしょうね。
当サイトも古くなった情報を更新するなどしなければとは思っているのですが…
| No.112 | 投稿日時: | 2003/10/07(火) 01:54 <↑親記事:No.111> |
| 投稿者: | 近藤 <E-Mail> |
ポジティヴな評価をありがとうございました。
公開直前まで、
「こんなものを公開して意味があるのだろうか?」と思っていたのですが、
インターネットの世界は
「見つからなかったものを追加」しておけば、
役立ててくれる人がいるかも知れませんね。