抽出トレーニングのベストプラクティス

プロジェクトの再トレーニングに必要な時間を短縮するために、次のトレーニング可能なグループロケータメソッドでは、トレーニングデータをナレッジベースにエクスポートすることができます。

これらのロケータの [抽出トレーニングセット] からドキュメントをエクスポートできます。ナレッジベースに追加したドキュメントは、トレーニングセットから完全に削除できます。トレーニングドキュメントを完全に削除しない場合は、トレーニングから除外されている別のトレーニングセットに移動します。トレーニングドキュメントをナレッジベースにエクスポートすると、プロジェクトのトレーニングに必要な時間は短縮されますが、トレーニングデータは失われません。[抽出トレーニングセット] 内のドキュメントに一致するものがない場合、オンラインラーニングシーケンスはナレッジベースを調べます。

その他のトレーニング可能なロケータメソッドもトレーニングドキュメントを収集しますが、これらのドキュメントをナレッジベースにエクスポートすることはできません。そのため、トレーニングドキュメントをインポートしてプロジェクトを再トレーニングするまで、トレーニングドキュメントが蓄積されます。

プロジェクトのトレーニング全体を改善するには、次のようにします。

トレーニング可能なグループロケータからナレッジベースにトレーニングデータをエクスポートします。
Transformation Designer の [新しいサンプル] を頻繁にインポートします。トレーニングドキュメントのインポートを怠ると、トレーニングの競合や抽出のエラーが発生する可能性が高くなります。
[Validation 後に自動トレーニング] 設定を利用します。この設定により、本番中に変更されたドキュメントのみが、収集されるドキュメントになります。
フィールドプロパティの [トレーニングダイアログに表示] 設定と、[ドキュメントを編集] ウィンドウの [トレーニングセットに追加] 設定を使用します。これらの設定により、トレーニングに使用されるフィールドが監視され、正しくトレーニングされます。

抽出トレーニングのベスト プラクティス

抽出トレーニングのベストプラクティス