コンテンツ分類
このタイプの分類は、クラスの詳細で [コンテンツ分類] が有効になっているクラスに使用されます。コンテンツ分類は、ドキュメントのテキスト認識結果を使用して分類結果を決定し、いくつかの小さなステップで構成されます。
プロジェクト構成に応じて、コンテンツ分類には次のものを含めることができます。
-
[プロジェクト設定] - [分類] タブで構成されるプロジェクト全体のコンテンツ分類子。
-
子クラスを持つクラスに対してクラスごとに構成されるサブツリー分類子。
-
[プロジェクト設定] で構成されている [TDS ページ分類子] - [ドキュメント分割] タブ (TDS が構成されている場合)。
-
コンテンツ分類を無効にすると、構成された [指示] は処理されなくなります。したがって、他のコンテンツ分類手段を使用しない場合でも、[指示] が構成されているときは、処理される指示のコンテンツ分類を有効にする必要があります。
これらのコンテンツ分類子はすべて単一のステップで処理され、最終的な分類結果を決定します。
ドキュメントのレイアウトに一貫性がない場合は、コンテンツ分類を使用します。コンテンツ分類を使用すると、クラスによってはドキュメントの先頭ページが変化し、ページ数に一貫性がなくなることがあります。
クラスにレイアウト分類とコンテンツ分類の両方が構成されている場合、コンテンツ分類は、レイアウト分類中に信頼度が高い結果が返されなかったときのみ実行されます。同様に、クラスのレイアウトに一貫性がない場合、通常はコンテンツ分類子のみを使用することで最良の結果が得られます。
コンテンツ分類でも [分類結果] が使用されます。このタイプの分類では、レイアウト分類よりも多くのトレーニング ドキュメントが必要になる場合があります。最良の結果を得るには、トレーニング ドキュメントを徐々に追加し、追加するたびにトレーニングしてテストします。テスト結果に満足したら、抽出設定を構成します。
テキスト認識を必要としないクラスに分類されているドキュメントを、コンテンツ分類子を使用するクラスに手動で再分類した場合、Knowledge Base Learning Server のシステム タスクは、このドキュメントを動的分類子に分類するトレーニングを行いません。
ドキュメントは、後でインポートできるよう、[新しいサンプル] ドキュメント セットに収集されます。