分割および分類オンライン ラーニング

ドキュメント分割または分類の結果が不十分なドキュメントが収集され、将来のバッチの改善に使用されるようにするには、ドキュメント分割および分類オンライン ラーニングを使用します。

ドキュメント分割および分類オンライン ラーニングは、プロジェクトに分類グループがあり、ドキュメント分割が有効になっている場合にのみ構成されます。

本番中に変更されたドキュメントは、自動的に収集されます。ただし、収集されたドキュメントの使用方法は、プロジェクトがどのように設定されているかによって異なります。

ドキュメントは、次のいずれかの方法で使用されます。

  1. 分割および分類の動的オンライン ラーニング.このタイプのオンライン ラーニングは、分類オンライン ラーニングが有効化されている場合のデフォルトのタイプです。このオンライン ラーニングにはダイナミック分類が設定されていて、分類の問題が発生するたびに、この分類子によってトレーニング ドキュメントが収集されています。Transformation Server はトレーニング フォルダに蓄積されたドキュメントを定期的に取得し、インポートして、プロジェクトをトレーニングします。後続のドキュメントにはこれらの追加されたトレーニング ドキュメントが役立つため、分類は時間とともに改善されます。

    プロジェクトで最良の結果を得るには、このタイプの分類オンライン ラーニングをお勧めします。

  2. ベーシックなドキュメント分割および分類オンライン ラーニングでは、トレーニング ドキュメントも自動的に収集されます。これらのドキュメントは、新しいサンプルのドキュメント セットにコピーされます。プロジェクト管理者はトレーニング ドキュメントをインポートできますが、これらが適用されるのは、プロジェクトを手動でトレーニングし、再公開した場合のみです。最良の結果を得るには、一定の間隔でプロジェクトをトレーニングします。

本番中に未知のドキュメントが検出され、手動で分割した場合、またはユーザーが特定のクラスに割り当てた場合、そのドキュメントはトレーニング ドキュメントとして収集されます。このクラスのドキュメントが次回に処理されるときは、認識精度が向上します。クラスごとにいくつかのドキュメントが収集され、分割および分類の結果が信頼できるものになると収集は停止します。

設定中にクラスごとに 1 つ以上のトレーニング ドキュメントを追加することをお勧めしますが、これは正常な分類結果を得るための必須条件でなくなりました。現在は、分割および分類オンライン ラーニングを使用できます。複数のクラスを持ち、分類トレーニング ドキュメントを持たない、全く新しいプロジェクトを本番環境に投入できます。ドキュメントが認識されず、手動での分割、再分類、または両方を行うたびに、トレーニング ドキュメントが収集されます。そのため、プロジェクトがトレーニング データなしで開始した場合でも、オンライン ラーニングによりドキュメントが収集され、プロジェクトの分割および分類の結果が時間とともに改善されます。

しばらくの間本番状態になっていたプロジェクトがあるにもかかわらず、新しいクラスを追加した場合は、プロジェクトを再公開し、分割および分類オンライン ラーニングを利用してドキュメントを収集し、新しいクラスの分割および分類を改善します。