混合印刷ページ認識プロファイルの追加

プロファイル設定で印刷タイプが指定されている場合、認識エンジンはドキュメント上のさまざまなタイプのフォントを認識できます。混合印刷ページ認識プロファイルは、2 つの事前定義された認識プロファイルを組み合わせて印字テキストと手書きテキストを認識することにより、全ページ認識を実行できます。

たとえば、次の場合に混合印刷ページ認識を使用します。

  • 印字テキストと手書きの注釈が含まれているドキュメント

  • 特定のゾーンに手書き文字を配置できないドキュメント

  • 署名を検出する必要があるドキュメント

  • 領収書や処方箋など、手書きテキストと印字テキストが混在するドキュメント

混合印刷ページ認識メソッドは、ページ上のすべての手書きテキストを認識し、テキスト全体をセグメント (手書きまたは印字) に分割して、これらのセグメンテーション結果を選択したプロファイルに転送します。使用されるドキュメントの種類に応じて、設定を調整できます。セグメンテーション結果を処理する方法は 2 つあります。2 つの個別のプロファイルでページ全体を認識する方法と、1 つのプロファイルのみで認識する方法です。1 つのプロファイルのみを使用する設定を選択した場合、混合印刷認識メソッドはドキュメント上の手書きテキストの割合をチェックしてから、印字プロファイルまたは手書きプロファイルのどちらでページを読み取るのかを決定します。スライダでパーセント値を調整することにより、閾値を最適化できます。

手書き認識用のゾーン認識プロファイルを選択した場合、単語区切り文字は自動的に決定する必要があります。これは、ゾーン認識プロファイルに単語区切り文字が含まれていないためです。単語区切り文字は次のように決定されます。

  • 印字ページのプロファイルが選択されている場合は、その単語区切り文字もゾーン認識に使用されます。

  • 印字用のプロファイルが選択されていない場合は、デフォルトの単語区切り文字 ( /:()-#) が適用されます。

手書きテキストまたは署名を含む領域の物理座標には、スクリプトを使用してアクセスできます。詳細については、「Kofax TotalAgility スクリプト ヘルプ」の「ドキュメントの署名の検出」トピックを参照してください。

[混合印刷] ページ認識プロファイルを追加できます。以下の手順に従って、設定します。

  1. [プロジェクト] タブの [構成] グループで、[プロジェクト設定] [プロジェクト設定] アイコン を選択します。
  2. [認識] タブを選択して認識設定を表示します。
  3. [ページ プロファイル] ボタンをクリックします。プロパティ ウィンドウが表示されます。
  4. [ページ認識エンジン] を選択します。

    別の認識エンジンを選択すると、ウィンドウに表示されるプロパティが自動的に更新されます。

  5. ページ認識プロパティを編集し、[OK] をクリックして設定を保存し、新しいプロファイルを追加します。
  6. 必要に応じて、新しいプロファイルの名前をわかりやすい名前に変更します。
  7. 必要に応じて、[OK] をクリックして [プロジェクト設定] ウィンドウを閉じます。
  8. プロジェクトの変更を保存します。