機種依存文字フィルター・ライブラリ
JIS X 0208:1997 で未定義のコードポイントの文字を下駄文字「〓」に変換します。デフォルトでは「区」単位で未定義コードポイントの判定を行いますが、設定によって「文字」単位で判定を行うようにもできます。
Perl4 形式 chkjis.pl ( chkjis.txt )
Perl5 形式 chkjis.pl ( chkjis.txt )
$line の文字列を $code の文字コードとみなして JIS X 0208:1997 で未定義のコードポイントの文字を下駄文字「〓」に変換します。$code に指定できる文字コードは 'sjis', 'euc', 'jis' のいずれかです。
JIS X 0208:1997 の未定義コードポイントのチェックを文字単位で行います。
JIS X 0208:1997 の未定義コードポイントのチェックを区単位で行います。(デフォルト)
#!/usr/local/bin/perl
require "chkjis.pl";
&chkjis::strict();
print "Content-type: text/plain; charset=Shift_JIS\n";
print "\n";
if (open(FILE, "kanjitbl.txt")) {
while (<FILE>) {
$line = $_;
&chkjis::filter(\$line, 'sjis');
print $line;
}
close(FILE);
}