抽出トレーニングのベスト プラクティス
プロジェクトの再トレーニングに必要な時間を短縮するために、次のトレーニング可能なグループ ロケータ メソッドでは、トレーニング データをナレッジベースにエクスポートすることができます。
これらのロケータの [抽出トレーニング セット] からドキュメントをエクスポートできます。ナレッジベースに追加したドキュメントは、トレーニング セットから完全に削除できます。トレーニング ドキュメントを完全に削除しない場合は、トレーニングから除外されている別のトレーニング セットに移動します。トレーニング ドキュメントをナレッジベースにエクスポートすると、プロジェクトのトレーニングに必要な時間は短縮されますが、トレーニング データは失われません。[抽出トレーニング セット] 内のドキュメントに一致するものがない場合、オンライン ラーニング シーケンスはナレッジベースを調べます。
その他のトレーニング可能なロケータ メソッドもトレーニング ドキュメントを収集しますが、これらのドキュメントをナレッジベースにエクスポートすることはできません。そのため、トレーニング ドキュメントをインポートしてプロジェクトを再トレーニングするまで、トレーニング ドキュメントが蓄積されます。
プロジェクトのトレーニング全体を改善するには、次のようにします。
-
トレーニング可能なグループ ロケータからナレッジベースにトレーニング データをエクスポートします。
-
Transformation Designer の [新しいサンプル] を頻繁にインポートします。トレーニング ドキュメントのインポートを怠ると、トレーニングの競合や抽出のエラーが発生する可能性が高くなります。
-
[Validation 後に自動トレーニング] 設定を利用します。この設定により、本番中に変更されたドキュメントのみが、収集されるドキュメントになります。
-
フィールド プロパティの [トレーニング ダイアログに表示] 設定と、[ドキュメントを編集] ウィンドウの [トレーニング セットに追加] 設定を使用します。これらの設定により、トレーニングに使用されるフィールドが監視され、正しくトレーニングされます。