分類と処理の順序
分類中に、分類子が特定の順序で処理されます。この順序は、どの分類子が有効になっているか、またトレーニング ドキュメントが存在するかどうかに応じて変化します。トレーニング ドキュメントはレイアウトおよびコンテンツ分類のみに使用されます。
すべての分類子が有効でトレーニング ドキュメントが存在する場合、順序は次のようになります。
-
レイアウト分類
-
コンテンツ分類
-
生成 AI 分類
これらの分類子のいずれかが無効化されているか、トレーニング ドキュメントが存在しない場合、その手順は省略されます。分類は、信頼度の高い分類結果が得られた場合に停止します。レイアウト分類後に停止が発生すると、その後の分類子は実行されなくなります。すべての分類子が失敗した場合、ドキュメントには無効というマークが付き、適切に処理されます。
最初に、レイアウト分類が実行されます。レイアウト分類子は認識結果に依存しないで分類を実行するため、レイアウト分類を使用するクラスは認識結果がなくても実行できます。
レイアウト分類が失敗した場合、クラスでレイアウト分類が使用されていない場合、またはクラスにレイアウト トレーニング ドキュメントがない場合、認識はコンテンツ分類を使用して実行されます。コンテンツ分類には、最上位のコンテンツ分類子、サブツリー分類子 (有効な場合)、指示分類子 (構成されている場合) が含まれます。
次に、生成 AI 分類が有効である場合は、レイアウト分類およびコンテンツ分類が失敗すると分類が処理されます。
子クラス
子クラスがあるプロジェクトの場合は、すべてのドキュメントに対して階層ルールが評価され、分類をさらに改善する必要性が判断されます。これらのルールは自動的に適用され、無効にすることはできません。これは、これらのルールを適用する際に、親子関係によって分類結果が妨げられないようにするためです。最終的な分類結果は、階層ルールと分類構成の両方に依存します。
たとえば、「親より優先される 1 つの子」階層ルールを実行したとします。この場合、レイアウト分類とコンテンツ分類の実行後に、親クラスとそれに関連する子クラスの信頼度が同じになっていれば、子クラスがドキュメントに対する分類結果になります。階層ルールによって子クラスが優先され、親クラスは上書きされます。
同様に、「競合する子を表す親」ルールを実行した場合、関連する子クラスの信頼度が同じであれば、親クラスが分類結果になります。