混合印刷ページ認識プロファイルの追加
このトピックの手順を使用して、[混合印刷] ページ認識プロファイルを追加します。
プロファイル設定で印刷タイプが指定されている場合、認識エンジンはドキュメント上のさまざまなタイプのフォントを認識できます。混合印刷ページ認識プロファイルは、2 つの事前定義された認識プロファイルを組み合わせて印字テキストと手書きテキストを認識することにより、全ページ認識を実行できます。
Azure AI Document Intelligence 認識エンジンは、この認識プロファイルでは選択できません。
たとえば、次の場合に混合印刷ページ認識を使用します。
-
印字テキストと手書きの注釈が含まれているドキュメント
-
特定のゾーンに手書き文字を配置できないドキュメント
-
署名を検出する必要があるドキュメント
-
領収書や処方箋など、手書きテキストと印字テキストが混在するドキュメント
混合印刷ページ認識メソッドは、ページ上のすべての手書きテキストを認識し、テキスト全体をセグメント (手書きまたは印字) に分割して、これらのセグメンテーション結果を選択したプロファイルに転送します。使用されるドキュメントの種類に応じて、設定を調整できます。セグメンテーション結果を処理する方法は 2 つあります。2 つの個別のプロファイルでページ全体を認識する方法と、1 つのプロファイルのみで認識する方法です。1 つのプロファイルのみを使用する設定を選択した場合、混合印刷認識メソッドはドキュメント上の手書きテキストの割合をチェックしてから、印字プロファイルまたは手書きプロファイルのどちらでページを読み取るのかを決定します。スライダでパーセント値を調整することにより、閾値を最適化できます。
手書き認識用のゾーン認識プロファイルを選択した場合、単語区切り文字は自動的に決定する必要があります。これは、ゾーン認識プロファイルに単語区切り文字が含まれていないためです。単語区切り文字は次のように決定されます。
-
印字ページのプロファイルが選択されている場合は、その単語区切り文字もゾーン認識に使用されます。
-
印字用のプロファイルが選択されていない場合は、デフォルトの単語区切り文字 ( /:()-#) が適用されます。
手書きテキストまたは署名を含む領域の物理座標には、スクリプトを使用してアクセスできます。詳細については、「Tungsten TotalAgility スクリプト ヘルプ」の「ドキュメントの署名の検出」トピックを参照してください。
手順
-
[プロジェクト] タブの [構成] グループで、[プロジェクト設定]
を選択します。
- [認識] タブを選択して認識設定を表示します。
- [ページ プロファイル] ボタンを選択します。プロパティ ウィンドウが表示されます。
-
[ページ認識メソッド] から [混合印刷] を選択します
混合印刷認識用にプロパティが自動的に更新されます。
-
次の設定を使用して、混合印刷ページ プロファイルを構成します。
[印字ページのプロファイル]
リストからページ プロファイルを選択して、ドキュメント内の印字されたテキストを認識します。(デフォルト: なし)
[手書きページまたはゾーンのプロファイル]
リストからページ プロファイルを選択して、ドキュメント内の手書きのテキストを認識します。(デフォルト: なし)
[セグメンテーション結果の処理]
使用するセグメンテーション処理のタイプを選択します。次の選択肢があります。
-
[セグメントを別々のプロファイルで読み取る] (デフォルト: 選択済み)
この値を選択すると、印字された文字と手書きされた文字がそれぞれの認識プロファイルに送られます。
-
[全ページを 1 つのプロファイルで読み取る]
この値を選択すると、ページ全体が単一の認識プロファイルに送信されます。プロファイルは、画像に存在している手書きのテキストの量によって決まります。セグメンテーションを使用する場合に最良の結果を得るには、手書きのページ プロファイルを選択します。
[手書きを認識するための最小の手書きされた領域]
手書きのテキストを認識するための最小の手書きテキスト領域またはピクセル比率を定義するために使用されるパーセント値を指定するために、スライダを使用するか、入力します。スライダは、「全ページを 1 つのプロファイルで読み取る」 が選択されている場合にのみ使用できます。(デフォルト: 50)
[背景を削除]
ドキュメントから線を削除します。(デフォルト: オフ)
-
- オプション。新しいプロファイルの名前をわかりやすい名前に変更します。
- オプション。[OK] を選択して [プロジェクト設定] ウィンドウを閉じます。
- プロジェクトの変更を保存します。