RecoStar の文字セットとパターン
RecoStar 認識エンジンを使用する場合は、コンテンツ タイプを選択するだけでなく、使用できる文字をさらに制限することができます。
重要 RecoStar 認識エンジンは、Kofax TotalAgility の次のリリースで削除される予定です。そのため、Kofax では、すべての新規プロジェクトのページ認識とゾーン認識で OmniPage 認識プロファイルを使用することを推奨しています。1 つ以上の RecoStar プロファイルを使用する既存のプロジェクトがある場合は、それらのプロジェクトを変更して、同等の OmniPage プロファイルを使用することもお勧めします。
「文字セット」 オプションでは、フィールドで使用できる文字と書式設定のマスクを指定します。基本的な文字セットは、選択した国およびコンテンツ タイプによって暗黙的に決定されます。次のマスクから選択します。
-
0-9: 使用できる文字を数字に限定する
-
A-Z: 使用できる文字を大文字に限定する
-
A-Za-z0-9: 使用できる文字を文字と数字に限定する
ゾーン内で検出された文字のうち、選択した文字セットの要件を満たさないものは、置換またはリジェクトと表示されます。
「パターン」 オプションでは、プロジェクト管理者は正規表現を使用して結果をさらに絞り込むことができます。これは、標準の論理的コンテクストが誤解を招く場合、または弱すぎる場合に便利です。たとえば、標準的な論理的コンテクストが、一般的なエクスペリエンス、辞書、およびトリグラム モードで動作するアルゴリズムによって制御されている場合などです。
重要 正規表現パターンが、互換性のない可能性のある文字セットとの組み合わせで指定されている場合、有効な記号は文字セットによって決まります。文字セットがなく、パターンが存在する場合、文字セットは再構築されるか、パターンでサポートされている文字まで拡張されます。