分類と処理の順序

分類中に、分類子が特定の順序で実行されます。

最初に、レイアウト分類が実行されます。レイアウト分類子は認識結果に依存しないで分類を実行するため、レイアウト分類を使用するクラスは認識結果がなくても実行できます。

レイアウト分類が失敗した場合、またはクラスでレイアウト分類を使用していない場合は、認識が実行され、続いてコンテンツ分類が実行されます。コンテンツ分類には、最上位のコンテンツ分類子サブツリー分類子 (有効な場合)、指示分類子 (構成されている場合) が含まれます。

子クラスがあるプロジェクトの場合は、すべてのドキュメントに対して階層ルールが評価され、分類をさらに改善する必要性が判断されます。これらのルールは自動的に適用され、無効にすることはできません。これは、これらのルールを適用する際に、親子関係によって分類結果が妨げられないようにするためです。最終的な分類結果は、階層ルールと分類構成の両方に依存します。

たとえば、「親より優先される 1 つの子」階層ルールを実行したとします。この場合、レイアウト分類とコンテンツ分類の実行後に、親クラスとそれに関連する子クラスの信頼度が同じになっていれば、子クラスがドキュメントに対する分類結果になります。階層ルールによって子クラスが優先され、親クラスは上書きされます。

同様に、「競合する子を表す親」ルールを実行した場合、関連する子クラスの信頼度が同じであれば、親クラスが分類結果になります。