FineReader ゾーンの認識プロファイル ウィンドウ

重要 FineReader 認識エンジンは、Kofax TotalAgility の次のリリースで削除される予定です。そのため、Kofax では、すべての新規プロジェクトのページ認識とゾーン認識で OmniPage 認識プロファイルを使用することを推奨しています。1 つ以上の FineReader プロファイルを使用する既存のプロジェクトがある場合、それらのプロジェクトを変更して、同等の OmniPage プロファイルを使用することもお勧めします。

このウィンドウを使用して、FineReader 認識ゾーンのプロファイルのプロパティを設定します。

重要 FineReader 12.2 を使用している場合、Transformation Server モジュールを実行する本番環境マシンは最大 40 コアに制限されます。
[言語]

このグループでは、次のいずれかの値を選択して、予期されるデータのタイプを指定できます。

  • [数値]

    ゾーンに数値のみが含まれる場合は、この値を選択します。たとえば、クレジット カードのフィールド、日付、電話番号などです。

  • [英数字]

    ゾーンにアルファベット、数字、その他の文字が含まれている場合は、この値を選択します。これは、このオプションのデフォルト値です。

[英数字] を選択した場合は、認識エンジンで認識される言語を選択できます。

[プリンタ タイプ]

このグループでは、予期される印刷またはフォントのタイプを選択できます。次の 1 つまたは複数を選択します。

  • [普通]これは、このオプションのデフォルト値です。

  • [タイプライター]

  • [マトリクス]

  • [インデックス]

  • [手動印刷]

  • [OCR A]

  • [OCR B]

  • [磁気 (E-13B)]

  • [磁気 (CMC-7)]

[手動印刷] タイプを選択した場合、次の設定を使用できます。

[書き込みスタイル]

手書きタイプを選択した場合は、手書きのテキストで使用する言語を選択します。この設定の値は、デフォルトで デフォルト に設定されています。

この書き込みスタイルの選択は、手書き文字にのみ適用されます。他のすべての文字タイプでは、言語リストで選択した言語を使用します。この設定の値は、デフォルトで [デフォルト] に設定されています。
[一般設定]

このグループには次の設定があります。

[大文字小文字認識モード]

次のいずれかの項目を選択して、認識エンジンで認識されたテキストの大文字と小文字をどのように処理するかを決定します。

  • [大文字小文字自動判別]

    認識エンジンでテキストの大文字小文字が自動的に判別されるようにする場合は、この値を選択します。これは、このオプションのデフォルト値です。

  • [小文字]

    認識エンジンですべてのテキストを小文字に変換する場合は、この値を選択します。

  • [大文字]

    認識エンジンですべてのテキストを大文字に変換する場合は、この値を選択します。

[フィールド マーク タイプ]

次の項目のいずれかを選択して、認識エンジンで文字間または単語間のマーキングを処理する方法を決定します。

選択したフィールド マーク タイプの例を、HANDPRINT 句を使用するセル数設定の下に示します。

  • [シンプル テキスト]

    テキストに単語や文字を区切る特殊なマーキングがない場合は、この項目を選択します。これは、このオプションのデフォルト値です。

  • [下線付きテキスト]

    ゾーン内のテキストに部分的に、または完全に下線が引かれている場合は、この項目を選択します。

  • [フレーム内のテキスト]

    ゾーン内のテキストがボックス内またはフレーム内にある場合は、この項目を選択します。

  • [灰色のボックス]

    ゾーン内のテキストが灰色の枠で囲まれたボックス内にある場合は、この項目を選択します。

  • [別のボックス]

    ゾーン内のテキストの個別のボックスに個別の文字がある場合は、この項目を選択します。

  • [単純組み合わせ]

    ゾーン内のテキストに個別の組み合わせに個別の文字がある場合は、この項目を選択します。

  • [フレーム内の組み合わせ]

    ゾーン内のテキストにフレーム内の個別の組み合わせに個別の文字がある場合、この項目を選択します。

  • [パーティション付きフレーム]

    ゾーン内のテキストがパーティション付きフレーム内にある場合は、この項目を選択します。

[セル数]

有効になっている場合、テキスト フィールドのセル パーティションの数を選択します。この設定は、上記のフィールド マーキング タイプの一部に対してのみ有効です。この設定の値は、デフォルトで 1 に設定されています。

[禁止上付き]

上付きテキストを認識して通常のテキストと同様に処理する場合は、この設定を選択します。この設定はデフォルトで選択されています。

[禁止下付き]

下付きテキストを認識して通常のテキストと同様に処理する場合は、この設定を選択します。この設定はデフォルトで選択されています。

[禁止斜字体]

斜体のテキストを認識して通常のテキストのように処理する場合は、この設定を選択します。この設定はデフォルトで選択されています。

[認識モード]

認識モードのタイプを次の値から選択します。

  • [高速モード]

    認識の精度よりも認識の速度を上げる場合は、この値を選択します。

    重要 この値を選択すると、認識の速度が上がることで結果の品質が低下する可能性があります。

  • [バランス モード]

    認識の精度と速度のバランスを取る場合は、この値を選択します。

  • [フル モード]

    認識の速度よりも認識の精度を高めたい場合は、この値を選択します。

    この値を選択すると、認識に時間がかかることがあります。

    これは、このオプションのデフォルト値です。

[テキスト言語オプション]

このグループには次の設定があります。

[暗黙のテキスト カテゴリ]

次のいずれかの設定を選択して、ゾーンに表示するテキストのタイプを定義します。

  • [未知]

    テキスト カテゴリが不明な場合にこの項目を選択します。これは、このオプションのデフォルト値です。

  • [ナチュラル テキスト]

    通常のテキストの場合、この項目を選択します。

  • [テーブル セル]

    テーブル セル内のテキストの場合、この項目を選択します。

  • [フォーム フィールド]

    フォーム内のテキストの場合、この項目を選択します。

  • [リスト]

    テキスト リストの場合、この項目を選択します。

[禁止文字]

OCR エンジンで無視する必要のある文字を入力します。この設定の値は、デフォルトで 空白

[レイアウト オプション]

このグループには次の設定があります。

[単一行]

ゾーンのコンテンツが同じ行にある場合は、この設定を選択します。この設定はデフォルトで選択されています。

[行当たり 1 語]

ゾーンの行に 1 つの単語がある場合は、この設定を選択します。この設定はデフォルトで選択されていません。

[ブロック当たり 1 行]

ブロックのコンテンツ (ゾーン内の段落など) が同じ行にある場合は、この設定を選択します。この設定はデフォルトで選択されています。

[辞書]
このグループでは、[参照] をクリックし、移動して、認識率を上げるのに役立つ辞書を選択できます。この設定の値は、デフォルトで <なし> に設定されています。

ウィンドウの下部にあるボタンの説明は、「共通 Transformation Designer ボタン」を参照してください。