RecoStar 認識用の新しい辞書テキスト ファイルの作成
RecoStar のページ認識およびゾーン認識用に独自の辞書を作成して、新しく作成したディレクトリに保存できます。製品の他の場所で使用される辞書とは異なり、これらの辞書は [プロジェクト設定] - [辞書] タブを使用しないで、手動で作成する必要があります。
重要 RecoStar 認識エンジンは、Kofax TotalAgility の次のリリースで削除される予定です。そのため、Kofax では、すべての新規プロジェクトのページ認識とゾーン認識で OmniPage 認識プロファイルを使用することを推奨しています。1 つ以上の RecoStar プロファイルを使用する既存のプロジェクトがある場合は、それらのプロジェクトを変更して、同等の OmniPage プロファイルを使用することもお勧めします。
辞書を更新する場合は必ず、この辞書を使用するプロジェクトを保存してください。こうすることで、更新された辞書を本番稼働中に使用することもできます。
注 新しく作成した辞書を最初に選択すると、名前が同じで拡張子が「hex」のバイナリ辞書ファイルが同じディレクトリに生成されます。
RecoStar 認識に使用する辞書テキスト ファイルを作成できます。以下の手順に従って、設定します。
- テキスト ファイルを作成します。
-
次の手順で、テキスト ファイルの構文を確認します。
- 辞書の各エントリが 1 行に配置されていることを確認します。
- 行がキャリッジ リターンとラインフィード (0x0D 0x0A) またはラインフィード (0x0A) で終了していることを確認します。(行末の空白は無視されます。)
- 語句が、1 行内にある、単一の空白で区切られた単語で構成されていることを確認します。
-
ファイル拡張子を使用してコード ページを指定します (すべてのエントリが大文字に変換されるため)。使用できる値は次のとおりです。
CENTRALEUROPE: 「ce」または「1250」
CYRILLIC: 「cy」または「1251」
LATIN1: 「we」または「1252」
GREEK: 「gr」または「1253」
TURKISH: 「tr」または「1254」
BALTIC: 「ba」または「1257」
注 不明な拡張子は LATIN1 に変換されます。