RecoStar ゾーン認識プロファイル設定 ウィンドウ

重要 RecoStar 認識エンジンは、Kofax TotalAgility の次のリリースで削除される予定です。そのため、Kofax では、すべての新規プロジェクトのページ認識とゾーン認識で OmniPage 認識プロファイルを使用することを推奨しています。1 つ以上の RecoStar プロファイルを使用する既存のプロジェクトがある場合は、それらのプロジェクトを変更して、同等の OmniPage プロファイルを使用することもお勧めします。

このウィンドウを使用して、RecoStar ゾーンの認識プロファイルのプロパティを設定します。

[国]

リストから 1 つまたは複数の国を選択して、この認識プロファイルでサポートされる国と言語の文字を指定します。選択済みの国は、内部トリグラム モードと既存の辞書にも対応しています。

デフォルトの国オプションは、プロジェクトが最初に作成されるときに、Kofax TotalAgility のユーザー インターフェイス言語によって指定されます。たとえば、プロジェクトの作成時にインターフェイスがドイツ語に設定されている場合、デフォルトの国オプションはドイツです。プロジェクトの作成後にアプリケーション言語を変更しても、デフォルトの国には影響しません。

[言語]

ドキュメントのテキストが機械印刷タイプと英数字のコンテンツ タイプに対応している場合にのみ、多言語設定で追加の認識オプションを使用します。

(オプションの) 括弧内の数字は、選択済みの国や言語の数を監視するのに役立ちます。これは、選択項目が非表示になっていて、選択項目を表示するためにスクロールする必要がある場合に特に重要です。
[画像の前処理]

このグループでは、次の事前定義済みの画像処理定義のいずれかを選択できます。

  • [<画像の前処理なし>]

  • [ドット、ラインを除去]

  • [ドットを除去] これは、このオプションのデフォルト値です。

  • [ライン、パンチ穴を除去]

  • [ラインを削除]

  • [網掛け、ドット、ライン、パンチ穴を除去]

  • [網掛け、ライン、パンチ穴を除去]

これらの定義済みの画像処理定義は認識の前に実行されます。[プロジェクト設定] - [画像クリーンアップ] タブで定義された画像クリーンアップ メソッドとは関係あり [ません]
[印刷タイプ]

このグループは、期待される印刷タイプを選択することにより、認識結果を改善するために役立ちます。次のいずれかの印刷タイプから選択します。

  • [未知] これは、このオプションのデフォルト値です。

  • [固定]

  • [手動印刷]

  • [機械印刷]

  • [OCR A]

  • [OCR B]

  • [Farrington 7B]

  • [CMC7]

  • [E13B]

[コンテンツ]

このグループには次のオプションがあります。

コンテンツ タイプ

次のいずれかのコンテンツ タイプを選択します。

  • [英数字] これは、このオプションのデフォルト値です。

  • [数値]

  • [金額]

[文字セット]

このオプションを使用して、認識テキストのマスクを指定します。このオプションの値は、デフォルトで設定されています。

[パターン]

このオプションを使用して、選択済みの文字セットで既に制限されているセグメント化と認識の選択肢を絞り込みます。このオプションの値は、 空白 デフォルトで設定されています。

[行数と間隔]

このグループには次のオプションがあります。

[行数]

これを使用して、ゾーン内の予想される行数を指定するか、実行するセグメンテーションのタイプを選択します。

  • [未知]ゾーン内の行数が不明な場合は、これを選択します。これは、このオプションのデフォルト値です。

  • [ドキュメント レイアウト]テキスト以外のすべての情報を無視して、複雑なレイアウトの領域からテキスト情報を抽出する場合は、これを選択します。

  • [手動]。予想される行数がわかっている場合は、これを選択します。右側のフィールドを使用して、予想される行数を設定します。

[機械印刷間隔]

これを使用して、機械で生成される文字のピッチ (水平間隔) を指定します。ピッチは、1 つの文字 (左端のピクセル) の開始から、次の文字の開始までを測定します。

  • [未知]ピッチが固定か可変かが不明な場合、これを選択します。この場合、認識エンジンでピッチのタイプ (固定または可変) とピッチの値が自動的に指定されようとします。これは、このオプションのデフォルト値です。

  • [固定]ピッチが一定であり、正確な値がわかっている場合は、これを選択します。

  • [変数]ピッチが一定でないことがわかっている場合、これを選択します。

  • [手動]。ピッチが固定されていて、正確な値がわかっている場合は、これを選択します。1/100 mm 単位で値を指定できます。デフォルトは 500 (5mm) です。ただし、170〜10000 の任意の整数値を指定できます。

[手動印刷間隔]

これを使用して、手動印刷文字のピッチ (水平間隔) を指定します。ピッチは、1 つの文字 (左端のピクセル) の開始から、次の文字の開始までを測定します。

  • [未知]ピッチが固定か可変かが不明な場合、これを選択します。この場合、認識エンジンでピッチのタイプ (固定または可変) とピッチの値が自動的に指定されようとします。これは、このオプションのデフォルト値です。

  • [固定]ピッチが一定であることがわかっていて、正確な値が不明な場合は、これを選択します。

  • [変数]ピッチが一定でないことがわかっている場合、このオプションを選択します。

  • [手動]。ピッチが固定されていて、正確な値を指定する場合は、これを選択します。1/100 mm 単位で値を指定できます。デフォルト値は 500 (5mm) です。ただし、360〜630 の任意の数を指定できます。

[トリグラム モード]

次のいずれかのトリグラム モードを選択します。

  • [オフ] これは、このオプションのデフォルト値です。

  • [チェック]

  • [修復]

[論理的コンテクスト]

トリグラム機能を有効にして、論理的コンテクストに基づいて不明な文字を解決する場合は、このオプションを選択します。このオプションはデフォルトで選択されています。

[辞書] グループを使用すると、認識に役立つ辞書を選択できます。サンプル辞書は Kofax TotalAgility で提供されます。さらに、独自の辞書を作成できます。デフォルトでは、辞書が選択されていません。右側のボタンをクリックすると、辞書が保存されているディレクトリを参照できます。認識プロファイルから辞書を削除するには、[<なし>] をクリックします。このオプションの値は、 <なし> デフォルトで設定されています。

重要 Kofax TotalAgility の以前のバージョンで作成したプロジェクトで変更された拡張サンプル辞書を使用できるようにするには、これらのファイルを <Install Directory>\Program Files\Common Files\Kofax\RecoStar40b\Dict から ..\RecoStar78\Dict ディレクトリにコピーする必要があります。

[完了]

認識結果の信頼度が低い場合に辞書から結果を返されるようにするには、これを選択します。このオプションはデフォルトではクリアになっています。

ウィンドウの下部にあるボタンの説明は、「共通 Transformation Designer ボタン」を参照してください。