Kofax Clarity ページ認識プロファイルの設定 ウィンドウ
この認識エンジンは、他のエンジンとは少し異なります。これは、人が身につけている ID バッジの写真や看板の写真など、あらゆる画像のテキストを認識するように特化されています。また、Kofax TotalAgility サーバーで OCR を実行する代わりに、OCR がインターネット接続を介してリモート サーバーで実行されます。
Kofax Clarity 認識プロファイルとサーバー間の通信は、ポート 443 を使用します。ファイアウォール設定でこのポートが開いている必要があります。
Transformation Designer でのテスト中に Kofax Clarity を使用して認識を実行する場合、ランタイム ライセンスが消費されます。プロジェクトの構成時およびテスト時にランタイム ライセンスの消費を減らすため、Kofax では、選択済みの画像のみで Kofax Clarity のテストを実行し、別の認識エンジンを使用して他のテスト画像またはトレーニング画像に対する OCR を実行することを推奨しています。
構成時には、フォールバック認識エンジンを構成せずに、この認識エンジンを何度か実行することをお勧めします。これにより、すべての機能が正常に働いて、利用可能な場合は適切なインターネット アクセスが確保されます。
このウィンドウを使用して、Kofax Clarity フル テキスト OCR プロファイルを設定できます。
- [言語]
-
このグループを使用すると、1 つまたは複数の特定の言語を選択したり、認識エンジンで言語自体を判別したりできます。
このグループには次のオプションがあります。
- [自動言語検出]
-
これを選択すると、Kofax Clarity 認識エンジンでドキュメントの言語を判別できます。このオプションはデフォルトで選択されています。
- [選択した言語]
-
ドキュメントで使用する言語を明示的に指定する場合は、このオプションを選択します。
選択すると、言語のリストが有効になります。1 つまたは複数の言語を選択します。
使用可能な言語のリストは、選択されている [認識モード] によって異なります。
ドキュメントが中国語、ギリシャ語、ヘブライ語、日本語、韓国語、またはタイ語の場合、これらは [ドキュメント モード] でサポートされません。これらの言語は [テキスト モード] ではサポートされますが、ドキュメントがそのこのモードに適していない場合があります。これらの言語のドキュメントで最良の結果を得るには、[選択した言語] オプションと [自動言語検出] オプションを使用して、両方のモードを完全にテストし、どの組み合わせが最適かを確認します。または、別の認識エンジンを選択します。
重要 ドキュメントで使用されている言語がわからない場合は、「自動言語検出」 オプションを使用します。これにより、間違った言語が選択された場合よりも OCR の結果が向上します。
- [一般設定]
-
このグループを使用すると、Kofax Clarity エンジンでのドキュメントの認識方法を指定できます。
このグループには次のオプションがあります。
- [認識モード]
-
次の認識モードを選択します。
-
[ドキュメント モード]
ドキュメントが従来の紙のドキュメント、フォーム、または高密度のテキスト画像の場合は、このモードを選択します。たとえば、請求書や銀行の信用状が挙げられます。このオプションはデフォルトで選択されています。
-
[テキスト モード]
少量のテキストが含まれる画像からテキストを検出して抽出する場合に選択します。たとえば、写真付きの ID カードが挙げられます。
-
- [単語区切り文字]
-
このフィールドを使用して、単語を区切る文字を定義します。
このオプションの値は、 /:()-# (スラッシュ、コロン、開く括弧と閉じ括弧、ハイフン、ポンド) デフォルトで設定されています。
- [フォールバック プロファイル]
-
Kofax Clarity 認識プロファイルを一時的に利用できない場合に、代わりに使用する認識エンジンを設定できます。これにより、ネットワーク接続が切断されても、OCR の結果が失敗した場合の処理が中断されません。
- [フォールバックに使用する認識プロファイル]
-
Kofax Clarity 認識プロファイルが使用できない場合に OCR を実行するページ認識プロファイルを選択します。このオプションの値は、 <None> デフォルトで設定されています。