chkjis.pl

機種依存文字フィルター・ライブラリ

機能

JIS X 0208:1997 で未定義のコードポイントの文字を下駄文字「〓」に変換します。デフォルトでは「区」単位で未定義コードポイントの判定を行いますが、設定によって「文字」単位で判定を行うようにもできます。

ダウンロード

Perl4 形式 chkjis.pl ( chkjis.txt )

Perl5 形式 chkjis.pl ( chkjis.txt )

リファレンス

&chkjis::filter(\$line, $code);

$line の文字列を $code の文字コードとみなして JIS X 0208:1997 で未定義のコードポイントの文字を下駄文字「〓」に変換します。$code に指定できる文字コードは 'sjis', 'euc', 'jis' のいずれかです。

&chkjis::strict();

JIS X 0208:1997 の未定義コードポイントのチェックを文字単位で行います。

&chkjis::nostrict();

JIS X 0208:1997 の未定義コードポイントのチェックを区単位で行います。(デフォルト)

使用例

サンプルを実行

#!/usr/local/bin/perl

require "chkjis.pl";
&chkjis::strict();

print "Content-type: text/plain; charset=Shift_JIS\n";
print "\n";

if (open(FILE, "kanjitbl.txt")) {
        while (<FILE>) {
                $line = $_;
                &chkjis::filter(\$line, 'sjis');
               print $line;
        }
        close(FILE);
}