単語区切り文字
Fuzzy データベースと一部のページ認識プロファイル用の「フィールド区切り文字」設定を使用すると、複合語の識別に使用できる文字を指定できます。いずれかの区切り文字が見つかると、この文字が認識され、この後の文字から新しい単語が始まります。
たとえば、ドキュメントに 「Diagon-Alley」 のような複合語が含まれている場合に、この複合語を 2 つの異なる単語と見なして検索するには、単語区切り文字を指定できます。この例では、ハイフン (-) が使用されている場合、「diagon」 と 「alley」 が個別に検索されて、評価されます。
デフォルトでは、Fuzzy データベースのデフォルト値としてハイフン (-) およびコンマ (,) が設定されています。ただし、ページ認識プロファイルのデフォルト値は異なることがあります。次の表に、各ページ認識プロファイルのデフォルトの単語区切り文字を示します。
認識プロファイル | デフォルトの単語区切り文字 |
---|---|
OmniPage 22.0.0.2 ページ認識 |
/:()-# |
Kofax Clarity 1.0 ページ認識 |
/:()-# |
混合印刷ページ認識 ** |
/:()-# |
** 印字の入力プロファイルとして選択されているプロファイルがない場合。