抽出トレーニングのベスト プラクティス
プロジェクトの再トレーニングに必要な時間を短縮するために、次のトレーニング可能なグループ ロケータ メソッドでは、トレーニング データをナレッジベースにエクスポートすることができます。
これらのロケータの [抽出トレーニング セット] からドキュメントをエクスポートできます。ナレッジベースに追加したドキュメントは、トレーニング セットから完全に削除できます。トレーニング ドキュメントを完全に削除しない場合は、トレーニングから除外されている別のトレーニング セットに移動します。トレーニング ドキュメントをナレッジベースにエクスポートすると、プロジェクトのトレーニングに必要な時間は短縮されますが、トレーニング データは失われません。[抽出トレーニング セット] 内のドキュメントに一致するものがない場合、オンライン ラーニング シーケンスはナレッジベースを調べます。
その他のトレーニング可能なロケータ メソッドもトレーニング ドキュメントを収集しますが、これらのドキュメントをナレッジベースにエクスポートすることはできません。そのため、トレーニング ドキュメントをインポートしてプロジェクトを再トレーニングするまで、トレーニング ドキュメントが蓄積されます。
プロジェクトのトレーニング全体を改善するには、次のようにします。
-
トレーニング可能なグループ ロケータからナレッジベースにトレーニング データをエクスポートします。
-
Transformation Designer の [新しいサンプル] を頻繁にインポートします。トレーニング ドキュメントのインポートを怠ると、トレーニングの競合や抽出のエラーが発生する可能性が高くなります。
-
「Validation 後に自動トレーニング」オプションを利用します。このオプションにより、本番中に変更されたドキュメントのみが、収集されるドキュメントになります。
-
フィールド プロパティの「トレーニング ダイアログに表示」オプションと、[ドキュメントを編集] ウィンドウの「トレーニング セットに追加」オプションを使用します。これらのオプションにより、トレーニングに使用されるフィールドが監視され、正しくトレーニングされます。