RecoStar ページ認識のプロファイル設定 ウィンドウ
このウィンドウを使用して、RecoStar フル テキスト認識のプロファイルのプロパティを設定します。
- [国]
-
リストから 1 つまたは複数の国を選択して、この認識プロファイルでサポートされる国と言語の文字を指定します。選択済みの国は、内部トリグラム モードと既存の辞書にも対応しています。
デフォルトの国オプションは、プロジェクトが最初に作成されるときに、Kofax TotalAgility のユーザー インターフェイス言語によって指定されます。たとえば、プロジェクトの作成時にインターフェイスがドイツ語に設定されている場合、デフォルトの国オプションはドイツです。プロジェクトの作成後にアプリケーション言語を変更しても、デフォルトの国には影響しません。
- [言語]
-
ドキュメントのテキストが機械印刷タイプと英数字のコンテンツ タイプに対応している場合にのみ、多言語設定で追加の認識オプションを使用します。
注 (オプションの) 括弧内の数字は、選択済みの国や言語の数を監視するのに役立ちます。これは、選択項目が非表示になっていて、選択項目を表示するためにスクロールする必要がある場合に特に重要です。
- [一般設定]
-
このグループは、次のオプションで認識結果を改善するのに役立ちます。
- [画像の前処理]
-
事前定義済みの画像処理定義のいずれかを選択します。定義済みの定義には、OCR を実行する前に削除する項目のいくつかの組み合わせが含まれています。このオプションの値は、シェーディング、ドット、ライン、パンチ穴を削除デフォルトで設定されています。
- [単語区切り文字]
-
このフィールドを使用して、単語を区切る文字を定義します。
このオプションの値は、 /:()-# (スラッシュ、コロン、開く括弧と閉じ括弧、ハイフン、ポンド) デフォルトで設定されています。
- [分割番号を修復]
-
このオプションを選択すると、近接しているものの、別の単語として認識される数値または数値の単語が自動的に結合されます。たとえば、エンジンで
[12]
と[00]
を、これらの 2 つの単語の間隔がスペースの 2 分の 1 未満であるとして読み取った場合、このオプションの結果は 1 つの結合された単語または[12.00]
になります。このオプションはデフォルトで選択されています。
- [印刷タイプ]
-
このグループは、期待される印刷タイプを選択することにより、認識結果を改善するために役立ちます。次のいずれかを選択します。
-
[未知] これは、このオプションのデフォルト値です。
-
[固定]
-
[手動印刷]
-
[機械印刷]
- [トリグラム モード]
-
次のいずれかのトリグラム モードを選択します。
-
[オフ] これは、このオプションのデフォルト値です。
-
[チェック]
-
[修復]
-
- [論理的コンテクスト]
-
トリグラム機能を有効にして、論理的コンテクストに基づいて不明な文字を解決する場合は、このオプションを選択します。このオプションはデフォルトで選択されています。
[辞書] グループを使用すると、認識に役立つ辞書を選択できます。サンプル辞書は Kofax TotalAgility で提供されます。さらに、独自の辞書を作成できます。デフォルトでは、辞書が選択されていません。右側のボタンをクリックすると、辞書が保存されているディレクトリを参照できます。認識プロファイルから辞書を削除するには、[<なし>] をクリックします。このオプションの値は、 <なし> デフォルトで設定されています。
重要 Kofax TotalAgility の以前のバージョンで作成したプロジェクトで変更された拡張サンプル辞書を使用できるようにするには、これらのファイルを <Install Directory>\Program Files\Common Files\Kofax\RecoStar40b\Dict から ..\RecoStar78\Dict ディレクトリにコピーする必要があります。 -
ウィンドウの下部にあるボタンの説明は、「共通 Transformation Designer ボタン」を参照してください。