RecoStar 認識用の新しい辞書テキスト ファイルの作成

RecoStar のページ認識およびゾーン認識用に独自の辞書を作成して、新しく作成したディレクトリに保存できます。製品の他の場所で使用される辞書とは異なり、これらの辞書は [プロジェクト設定] - [辞書] タブを使用しないで、手動で作成する必要があります。

重要 RecoStar 認識エンジンは、Kofax TotalAgility の次のリリースで削除される予定です。そのため、Kofax では、すべての新規プロジェクトのページ認識とゾーン認識で OmniPage 認識プロファイルを使用することを推奨しています。1 つ以上の RecoStar プロファイルを使用する既存のプロジェクトがある場合は、それらのプロジェクトを変更して、同等の OmniPage プロファイルを使用することもお勧めします。

辞書を更新する場合は必ず、この辞書を使用するプロジェクトを保存してください。こうすることで、更新された辞書を本番稼働中に使用することもできます。

新しく作成した辞書を最初に選択すると、名前が同じで拡張子が「hex」のバイナリ辞書ファイルが同じディレクトリに生成されます。

RecoStar 認識に使用する辞書テキスト ファイルを作成できます。以下の手順に従って、設定します。

  1. テキスト ファイルを作成します。
  2. 次の手順で、テキスト ファイルの構文を確認します。
    1. 辞書の各エントリが 1 行に配置されていることを確認します。
    2. 行がキャリッジ リターンとラインフィード (0x0D 0x0A) またはラインフィード (0x0A) で終了していることを確認します。(行末の空白は無視されます。)
    3. 語句が、1 行内にある、単一の空白で区切られた単語で構成されていることを確認します。
    4. ファイル拡張子を使用してコード ページを指定します (すべてのエントリが大文字に変換されるため)。使用できる値は次のとおりです。

      CENTRALEUROPE: 「ce」または「1250」

      CYRILLIC: 「cy」または「1251」

      LATIN1: 「we」または「1252」

      GREEK: 「gr」または「1253」

      TURKISH: 「tr」または「1254」

      BALTIC: 「ba」または「1257」

      不明な拡張子は LATIN1 に変換されます。