レイアウト分類子のプロパティ ウィンドウ

このウィンドウを使用して、レイアウト分類子のプロパティを構成します。

[分類最適化対象]
  • 請求書。(デフォルト:選択済み)

    この設定を選択すると、分類子によって、ドキュメントの上部のみ、下部のみが分析されます。ドキュメントの残りの部分は分類に使用されません。ヘッダ領域とフッタ領域が事前に印刷されていることが多いため、これは請求書に特に役立ちます。同様の構造を持つ他のタイプのビジネス ドキュメントにも適用できます。

  • フォーム。

    この設定を選択すると、分類子で画像の領域全体を使用します。これは、画像の領域全体に固定されたレイアウトがあるフォームやその他のタイプのドキュメントに使用できます。

詳細プロパティを変更する場合は、[アドバンスト] をクリックして詳細プロパティにアクセスします。

[画像準備]

このグループには次の設定があります。

[傾斜許容を有効化]

この設定は、処理されたドキュメントが他のアプリケーションによってすでに傾斜を是正されている場合には使用できません。たとえば、スキャン中に VRS を使用する場合、傾斜した画像が VRS によって自動的に調整されるため、この設定を選択する必要はありません。(デフォルト:選択済み)

[トレーニング]

このグループには次の設定があります。

[クラス当たりの最大サンプル数]

レイアウト分類子では、クラスごとに無制限の数のサンプルがサポートされます。サンプル画像が大幅に異なる場合、レイアウト分類子は各サンプルのさまざまなパターンを内部的に学習します。パフォーマンス上の理由から、機能の抽出に使用されるサンプル ドキュメントの数を制限することが必要な場合があります。値 0 は制限がないことを意味します。(デフォルト:0)

[クラスの均質性]

この機能は、トレーニング セット内の画像のレイアウトの差異に対する分類子の感度をコントロールします。サンプル画像が大幅に異なる場合、レイアウト分類子は新しいタイプごとに内部パターンを自動的に作成します。これらのタイプはユーザーには表示されません。

タイプが多いほど分類精度は高くなりますが、タイプを増やすと分類速度が遅くなります。このコントロールによって設定される値は、新しい内部タイプが作成されるタイミングを決定する閾値です。ほとんどの場合、デフォルト値が最適です。(デフォルト:80.0)

[ノイズ フィルタ]

このグループには次の設定があります。

この機能により、コントラストの低い領域を照合する方法をコントロールします。たとえば、細かい背景パターンを持つ画像があるとします。「最大精度」に近い値を設定すると、コントラストの低い画像は分類されません。つまり、トレーニング セットのドキュメントであっても、信頼度は 100% になりません。誤って分類されたドキュメントを取得する可能性ははるかに小さくなり、結果として精度は高くなりますが、リジェクト数は多くなります。[最大リコール] に近い値を設定した場合、コントラストが低いドキュメントに対して高い信頼度値が返されます。ただし、これはドキュメントの同じ領域でコントラストが低い他のクラスに対して高い信頼度値が決定されることを意味し、エラー率が高くなる可能性があります。ほとんどの場合、デフォルト値が最適です。(デフォルト:15.0)

ウィンドウの下部にあるボタンの説明は、「共通 Transformation Designer ボタン」を参照してください。