機種依存文字フィルター・ライブラリ
JIS X 0208:1997 で未定義のコードポイントの文字を下駄文字「〓」に変換します。デフォルトでは「区」単位で未定義コードポイントの判定を行いますが、設定によって「文字」単位で判定を行うようにもできます。
Perl4 形式 chkjis.pl ( chkjis.txt )
Perl5 形式 chkjis.pl ( chkjis.txt )
$line の文字列を $code の文字コードとみなして JIS X 0208:1997 で未定義のコードポイントの文字を下駄文字「〓」に変換します。$code に指定できる文字コードは 'sjis', 'euc', 'jis' のいずれかです。
JIS X 0208:1997 の未定義コードポイントのチェックを文字単位で行います。
JIS X 0208:1997 の未定義コードポイントのチェックを区単位で行います。(デフォルト)
#!/usr/local/bin/perl require "chkjis.pl"; &chkjis::strict(); print "Content-type: text/plain; charset=Shift_JIS\n"; print "\n"; if (open(FILE, "kanjitbl.txt")) { while (<FILE>) { $line = $_; &chkjis::filter(\$line, 'sjis'); print $line; } close(FILE); }