ASF:文字属性を意識した検索ツールOS/2版
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-
属性を意識したテキスト検索ツール
A S F . E X E
ver.0.04
浜口 崇 (C) 1999-2000
htakashi@mse.biglobe.ne.jp
NBC03301@nifty.ne.jp
http://www2d.biglobe.ne.jp/~htakashi/indexj.html
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-
【はじめに】
Kobe Phoenix Lab.ではこれまでにいくつかの文字列検索ソフトを公開してきました
が、いずれもテキストに文字属性が入っていないことを前提にして作成してきました。
しかし、実際には文字書式情報を含んだテキストファイルはたくさん存在します。例え
ばHTML、RTF。他にもテキストファイル印刷ツールが使う制御命令などいろいろありま
す。
このツールはそういった文字書式を利用して検索するツールです。
【動作環境】
DOS版 : MS-DOS / PC-DOS(PC9801系は対象外)
OS/2版 : OS/2 Warp以降
【使い方】
□コマンドライン
[DOS版]
asf.exe [オプション] キーワード 検索対象ファイル[Enter]
見本としてtest.bat(PRT++形式用)とtest_h.bat(HTML形式用)を添付しています
のでそちらも参考にしてください
[OS/2版]
asf2.exe [オプション] キーワード 検索対象ファイル[Enter]
見本としてtest.cmd(PRT++形式用)とtest_h.cmd(HTML形式用)を添付しています
のでそちらも参考にしてください
□検索対象テキスト
テキスト形式でなおかつ文字属性を保管できるものが対象となります。現在サ
ポートしているのは次のものだけです
・PRT++形式
\i : イタリック体
\f : ボールド体
\t : 上付き文字
\s : 下付き文字
\u : 下線
・HTML形式
<I> : 斜体
<B> : 太字
<U> : 下線
<S> : 打消し線
<SUP> : 上付き文字
<SUB> : 下付き文字
・TEXT形式
_と_で挟まれた間が斜体
*と*で挟まれた間がボールド体
・将来以下の形式もサポートするかもしれません
TeX/LaTeX/RTF
□オプション
◇入力テキスト書式指定
-fh : HTML形式
-fp : PRT++形式[DEFAULT]
-fr : RTF形式(未実装)
-ft : Text形式
-fl : LaTeX/TeX形式(未実装)
1つの形式しか使わないのであれば次のように実行ファイルをリネームして
デフォールト値を変えても使えます
HTML形式用 asfh.exe
RTF形式用 asfr.exe
TEXT形式用 asft.exe
LaTeX形式 asfl.exe
◇検索結果出力書式指定
-n : 行番号を出力
-t : ファイル名を出力
◇検索モード指定
-ms : [Strict]属性が完全に一致した場合のみ出力
例)太字斜体を検索したい場合に使います。文字属性がないものを検索
する場合にも使います
-m : [Default]属性がひとつでも一致した場合のみ出力
例)太字または斜体どちらか少なくとも一方が指定されているものを検
索したい場合に使います
-mi : 大文字小文字同一視
◇正規表現指定(OS/2版のみ)
-r : 正規表現を使う
◇単語検索指定
-w : 単語検索あり
英文専用です。日本語テキストでは使わないでください
-w : 単語の前後とも認識します
-w0 : 同上
-w1 : 単語の前だけ認識します
-w2 : 単語の後ろだけ認識します
-w10 : 単語の前後とも認識します
(キーワード直後のシングルクォートは区切り記号とはみなしません)
-w12 : 単語の後ろだけ認識します
(キーワード直後のシングルクォートは区切り記号とはみなしません)
-w20 : 単語の前後とも認識します
(キーワード直後のハイフンは区切り記号とはみなしません)
-w22 : 単語の後ろだけ認識します
(キーワード直後のハイフンは区切り記号とはみなしません)
-w30 : 単語の前後とも認識します
(キーワード直後のシングルクォートとハイフンは区切り記号とはみな
しません)
-w32 : 単語の後ろだけ認識します
(キーワード直後のシングルクォートとハイフンは区切り記号とはみな
しません)
◇キーワード文字属性指定
-b : [BOLD]太字
-i : [ITALICS]斜体
-s : [STRIKE]打消し線
-u : [UNDERLINE]下線
-sp : [SUPERSCRIPT]上付き文字
-sb : [SUBSCRIPT]下付き文字
内部的にはもう少し扱えるのですが指定方法を考えて今のところこれだけにし
ぼっています。頭文字がダブったりするので(^_^;)
【その他の仕様】
・1行として扱えるのは改行を含み1024バイトまで
・日付を扱っていませんので2000年問題は関係ありません
・出力される結果行は書式指定文字列を取り除いたものです
・文字コード変換はおこなっていませんので、EUC/JISなテキストでは正しく読めな
いことがあります
サポート用メールマガジン
サポート情報をお届けするためのメールマガジン(不定期発行・無料・登録自由)を用意しています。お気軽にお申し込みください。
|ソフトウェア広場へ
|2号館トップへ
|3号館へ|
御意見・御要望はこちらへどうぞm(__)m :
<htakashi@mse.biglobe.ne.jp>