ドキュメント分割および分類の [新しいサンプル] とプロジェクトのライフ サイクル
プロジェクトが最初に本番状態になった時点では、ドキュメント分割と分類の結果は理想的なものではありません。プロジェクトが最初に公開され、より多くのトレーニング ドキュメントが蓄積されるにつれて、収集されるドキュメント数は少なくなり、プロジェクトの本番状態は長く続くようになります。これは、手動分割が必要なドキュメント数または未分類となるドキュメント数が減少するためです。そのため、新しいプロジェクトでは特定のタスクをより頻繁に実行する必要があります。
[アドバンスト] ウィンドウで [{0}中に動的分類子を使用] 設定が有効になっている場合は、ドキュメント分割と分類を改善するために、本番中にトレーニング ドキュメントが使用されます。これにより、手動で分割されるドキュメントの数と再分類されるドキュメントの数が最小限に抑えられるため、蓄積されるトレーニング ドキュメントの数が減ります。
[{0}中に動的分類子を使用] 設定を有効にしていない場合は、ドキュメントがインポートされ、プロジェクトが再トレーニングされて公開されるまで、収集されたドキュメントは効力を持ちません。
動的分類が有効になっている場合、トレーニング ドキュメントが蓄積されると、ドキュメントは動的分類子に分類され、新しいサンプル分類ドキュメントのサブセットにコピーが保存されます。
動的分類が有効になっていない場合、蓄積されたドキュメントは単に新しいサンプルに分類され、プロジェクトの役には立ちません。
トレーニング ドキュメントを分類結果に定期的に移動するには、分類の新しいサンプルをインポートし、次の時間間隔後にプロジェクトをトレーニングします。
-
1 週間後
-
2 週間後
-
3 週間後
-
4 週間後
-
2 か月後
-
3 か月後
-
6 か月後
-
1 年後
1 年が経過すると、プロジェクトのドキュメントは正常に処理されるようになり、多くの問題が発生することはなくなります。現在、トレーニング ドキュメントが収集されるのは、新しいベンダーまたはフォームが検出されたときだけです。引き続きプロジェクトの監視とドキュメントのインポートを行い、約 6 か月ごとにプロジェクトを再トレーニングします。