レイアウト分類

レイアウト分類は、ドキュメントの物理レイアウトを調べて分類結果を決定する単一のプロジェクト全体のレイアウト分類子に依存しています。固定フォームなど、ドキュメントに一貫したレイアウトがある場合は、レイアウト分類を使用します。ドキュメントの最初のページを簡単に認識できる場合は、同じレイアウトで他のドキュメントを分類することができます。ただし、このタイプの分類は、[分類結果] のトレーニング ドキュメントにのみ依存しています。トレーニング ドキュメントがないと、レイアウト分類子でドキュメントを認識できません。

[分類結果] には、レイアウト分類のために永続的に保存された白黒画像が必要です。[分類結果] にカラー画像またはグレースケール画像を追加してトレーニングすると、画像の白黒バージョンが作成され、プロジェクト ディレクトリのサブフォルダに保存されます。

プロジェクトのクラスごとに、いくつかのトレーニング ドキュメントが必要です。最良の結果を得るには、レイアウト分類を使用して、クラスに単一のトレーニング ドキュメントを追加します。次に、プロジェクトをトレーニングして、分類結果をテストします。1 つのトレーニング ドキュメントで信頼度の高い結果が得られた場合、追加のトレーニング ドキュメントが必要となることはほとんどありません。分類結果に満足できない場合は、満足できるようになるまで、トレーニング ドキュメントを 1 つずつ追加します。

レイアウト分類結果がある場合は、それが分類順番が最後の分類結果として受け入れられます。レイアウト分類子で分類結果を判別できない場合は、コンテンツ分類が実行されます。