単語区切り文字

Fuzzy データベースと一部のページ認識プロファイル用の「フィールド区切り文字」設定を使用すると、複合語の識別に使用できる文字を指定できます。いずれかの区切り文字が見つかると、この文字が認識され、この後の文字から新しい単語が始まります。

たとえば、ドキュメントに Diagon-Alley のような複合語が含まれている場合に、この複合語を 2 つの異なる単語と見なして検索するには、単語区切り文字を指定できます。この例では、ハイフン (-) が使用されている場合、diagonalley が個別に検索されて、評価されます。

デフォルトでは、Fuzzy データベースのデフォルト値としてハイフン (-) およびコンマ (,) が設定されています。ただし、ページ認識プロファイルのデフォルト値は異なります。次の表に、各ページ認識プロファイルのデフォルトの単語区切り文字を示します。

テーブル 1. ページ認識プロファイルのデフォルトの単語区切り文字
認識プロファイル デフォルトの単語区切り文字

FineReader 12.2 ページ認識

/:()-#

OmniPage 21.0 ページ認識

/:()-#

筆記体ページ認識 *

  • Check Reader 11.1

  • Field Reader 8.1

  • Document Reader 8.1

該当なし

混合印刷ページ認識 **

/:()-#

* これらの認識エンジンはデフォルトでインストールされず、追加のライセンスが必要です。

** 機械印刷の入力プロファイルとして選択されているプロファイルがない場合。

重要 FineReader 認識エンジンは、Kofax TotalAgility の次のリリースで削除される予定です。そのため、Kofax では、すべての新規プロジェクトのページ認識とゾーン認識で OmniPage 認識プロファイルを使用することを推奨しています。1 つ以上の FineReader プロファイルを使用する既存のプロジェクトがある場合、それらのプロジェクトを変更して、同等の OmniPage プロファイルを使用することもお勧めします。