抽出トレーニングのベスト プラクティス

プロジェクトの再トレーニングに必要な時間を短縮するために、次のトレーニング可能なグループ ロケータ メソッドでは、トレーニング データをナレッジベースにエクスポートすることができます。

これらのロケータの [抽出トレーニング セット] からドキュメントをエクスポートできます。ナレッジベースに追加したドキュメントは、トレーニング セットから完全に削除できます。トレーニング ドキュメントを完全に削除しない場合は、トレーニングから除外されている別のトレーニング セットに移動します。トレーニング ドキュメントをナレッジベースにエクスポートすると、プロジェクトのトレーニングに必要な時間は短縮されますが、トレーニング データは失われません。[抽出トレーニング セット] 内のドキュメントに一致するものがない場合、オンライン ラーニング シーケンスはナレッジベースを調べます。

その他のトレーニング可能なロケータ メソッドもトレーニング ドキュメントを収集しますが、これらのドキュメントをナレッジベースにエクスポートすることはできません。そのため、トレーニング ドキュメントをインポートしてプロジェクトを再トレーニングするまで、トレーニング ドキュメントが蓄積されます。

プロジェクトのトレーニング全体を改善するには、次のようにします。

  • トレーニング可能なグループ ロケータからナレッジベースにトレーニング データをエクスポートします。

  • Transformation Designer の [新しいサンプル]頻繁にインポートします。トレーニング ドキュメントのインポートを怠ると、トレーニングの競合や抽出のエラーが発生する可能性が高くなります。

  • 「Validation 後に自動トレーニング」オプションを利用します。このオプションにより、本番中に変更されたドキュメントのみが、収集されるドキュメントになります。

  • フィールド プロパティの「トレーニング ダイアログに表示」オプションと、[ドキュメントを編集] ウィンドウの「トレーニング セットに追加」オプションを使用します。これらのオプションにより、トレーニングに使用されるフィールドが監視され、正しくトレーニングされます。