手動と自動の分類手法
Transformation Designer で分類を構成せずにドキュメント処理を続行するには、その前に手動でドキュメントを分類する必要があります。
手動分類は通常、階層スキームに従います。最初に、ドキュメントのメイン カテゴリが決定されます。最終的なドキュメント カテゴリが決定されるまで、いくつかのステップで分類がさらに調整されます。Tungsten TotalAgility では、自動分類で同じ結果が得られるように、手動分類階層スキームを複製できます。
自動分類を構成するには、クラス階層が必要です。この階層は、プロジェクト ツリー内で作成および維持されます。プロジェクト ツリーに追加された各クラスで、利用可能な分類結果を表すことができます。このプロジェクト ツリーとプロジェクト分類設定を組み合わせることで、本番用のドキュメントの分類結果が決まります。
レイアウト分類子とアダプティブ機能分類子の両方で、サンプルによる学習がサポートされます。最初のステップでは、サンプル ドキュメントを各クラスに割り当てます。次に、分類エンジンによってトレーニング プロセスが実行されます。このプロセスでは、すべてのサンプル ドキュメントが分析され、重要な機能が抽出されて、各クラスの分類結果を定義するために使用されます。次のステップが発生します。
-
カテゴリの定義
-
サンプル セットの作成
-
機能の抽出と学習
-
未知のドキュメントの分類
-
自動改善と段階的学習
分類オンライン ラーニングも使用できるようになりました。有効にすると、分類に失敗したドキュメントの中で、Validation 中に手動で分類する必要があるものが [分類結果] に追加されます。最大数に達していない限り、ドキュメントは蓄積されます。次回にこのクラスのドキュメントが検出されると、信頼度は向上します。[分類結果] に十分なサンプル ドキュメントが含まれている場合は、手動分類が不要になることがあります。