トレーニング可能なドキュメント分割

デフォルトでは、このタイプの分割はすべての新しいプロジェクトで無効になっています。つまり、Transformation Server で個々のページの分類方法に基づいてドキュメントを分割します。[プロジェクト設定] ウィンドウの [ドキュメント分割] タブで分割設定を構成します。

クラス内でドキュメントの最初のページのコンテンツとレイアウトが異なる場合は、このタイプのドキュメント分割を使用します。この分類タイプでは、各分類結果の最初のページ、中のページ、最後のページをトレーニングできるため、ドキュメントの長さが一貫していない場合にも役立ちます。

ドキュメント分割のオンライン ラーニングを使用しない場合も、プロジェクトに分割のトレーニングを行うことができきます。各分類タイプの典型的な例を含む大きなトレーニング セットを使用して、プロジェクトをトレーニングする前にこれらのドキュメントを [分類結果] に追加します。

ドキュメント分割オンライン ラーニングを使用するということは、ユーザーがドキュメントを手動で分割または再分類するたびに、そのドキュメントが収集され、同じレイアウトの後続のドキュメントの分割を改善するために使用されるということです。最高のドキュメント分割結果を得るには、手動でトレーニングされたドキュメントとオンライン ラーニングを組み合わせて使用します。既知のドキュメント タイプのトレーニング ドキュメントを追加すると、これらが正常に分割および分類されるようになります。本番中に新しいドキュメント タイプが検出されると、オンライン ラーニングによってこれらのドキュメント タイプがトレーニングされます。

たとえば、通信を認識するようにプロジェクトを構成します。ほとんどの通信は、長さ、内容、およびレイアウトが異なります。Transformation Server では通信のレターにある典型的な最初のページ、中のページ、最後のページの内容を認識できるため、トレーニング可能なドキュメント分割がこのタイプのドキュメントに適しています。

分類子のプロパティを変更した後、またはトレーニング セットにドキュメントを追加または削除した後は、プロジェクトを再トレーニングする必要があります。