レイアウト分類子の初期化と構成
このトピックの手順を使用して、レイアウト分類子を初期化し、プロジェクト内でレイアウト分類を使用します。
[リセット]
ボタンが無効になっている場合、レイアウト分類子は初期化されません。
最初にプロジェクトを作成するときには、プロジェクトにレイアウト分類子がありません。これは、一部のクラスでレイアウト分類が有効になっている場合でも当てはまります。レイアウト分類は、一貫したレイアウトがあるドキュメントのクラスに使用されます。フォームと請求書は、レイアウト分類を使用して正常に分類されたドキュメントの例です。
プロジェクトごとに 1 つのレイアウト分類子があります。レイアウト分類を使用するすべてのクラスで、この分類子が使用されます。プロジェクト全体に適するようにレイアウト分類子を構成します。
手順
-
[プロジェクト] タブの [構成] グループで、[プロジェクト設定]
を選択します。
- 分類設定を表示するには、[分類] タブを選択します。
-
[レイアウト分類] グループで、[レイアウト分類子] の [プロパティ]
ボタンを選択します。
[レイアウト分類子のプロパティ] ウィンドウが表示されます。
-
[分類最適化対象] 設定から、次のいずれかの値を選択します。
- [請求書]:
-
この設定を選択すると、分類子によって、ドキュメントの上部のみ、下部のみが分析されます。ドキュメントの残りの部分は分類に使用されません。ヘッダ領域とフッタ領域が事前に印刷されていることが多いため、これは請求書に特に役立ちます。これは、同様の構造を持つ他のタイプのビジネス ドキュメントにも適用することができます。(デフォルト: 選択済み)
- [フォーム]:
-
この設定を選択すると、分類子で画像の領域全体を使用します。これは、画像の領域全体に固定されたレイアウトがあるフォームやその他のタイプのドキュメントに使用できます。
-
追加の設定にアクセスするには、[詳細] を選択します。
追加の設定は利用可能です。
-
次の詳細設定を構成します。
[傾斜許容を有効化]
この設定は、処理されたドキュメントが他のアプリケーションによってすでに傾斜を是正されている場合には使用できません。たとえば、スキャン中に VRS を使用している場合、傾斜した画像が VRS によって自動的に調整されるため、この設定を選択する必要はありません。(デフォルト: 選択済み)
[クラス当たりの最大サンプル数]
レイアウト分類子では、クラスごとに無制限の数のサンプルがサポートされます。サンプル画像が大幅に異なる場合、レイアウト分類子は各サンプルのさまざまなパターンを内部的に学習します。パフォーマンス上の理由から、機能の抽出に使用されるサンプル ドキュメントの数を制限することが必要な場合があります。値 0 は制限がないことを意味します。(デフォルト: 0)
[クラスの均質性]
この機能は、トレーニング セット内の画像のレイアウトの差異に対する分類子の感度をコントロールします。サンプル画像が大幅に異なる場合、レイアウト分類子は新しいタイプごとに内部パターンを自動的に作成します。これらのタイプはユーザーには表示されません。(デフォルト: 80.0)
タイプが多いほど分類精度は高くなりますが、タイプを増やすと分類速度が遅くなります。このコントロールによって設定される値は、新しい内部タイプが作成されるタイミングを決定する閾値です。ほとんどの場合、デフォルト値が最適です。
[ノイズ フィルタ]
この機能により、コントラストの低い領域を照合する方法をコントロールします。たとえば、細かい背景パターンを持つ画像があるとします。(デフォルト: 15.0)
「最大精度」に近い値を設定した場合、コントラストの低い画像は分類されません。つまり、トレーニング セットのドキュメントであっても、信頼度は 100% になりません。誤って分類されたドキュメントを取得する可能性ははるかに小さくなり、結果として精度は高くなりますが、リジェクト数は多くなります。
「[最大リコール]」 に近い値を設定すると、コントラストが低いドキュメントに対してより高い信頼値が返されます。ただし、これはドキュメントの同じ領域でコントラストが低い他のクラスに対して高い信頼度値が決定されることを意味し、エラー率が高くなる可能性があることを意味します。ほとんどの場合、デフォルト値が最適です。
-
[OK] を選択して変更を保存し、[レイアウト分類子のプロパティ] ウィンドウを閉じます。
[レイアウト分類子のプロパティ] ウィンドウが閉じ、レイアウト分類子が初期化されて、[リセット] ボタンが有効になります。
- オプション。[OK] を選択して [プロジェクト設定] ウィンドウを閉じます。
- プロジェクトの変更を保存します。
- オプション。分類設定をテストします。