抽出トレーニングのベスト プラクティス

プロジェクトの再トレーニングに必要な時間を短縮するために、次のトレーニング可能なグループ ロケータ メソッドでは、トレーニング データをナレッジベースにエクスポートすることができます。

これらのロケータの [抽出トレーニング セット] からドキュメントをエクスポートできます。ナレッジベースに追加したドキュメントは、トレーニング セットから完全に削除できます。トレーニング ドキュメントを完全に削除しない場合は、トレーニングから除外されている別のトレーニング セットに移動します。トレーニング ドキュメントをナレッジベースにエクスポートすると、プロジェクトのトレーニングに必要な時間は短縮されますが、トレーニング データは失われません。[抽出トレーニング セット] 内のドキュメントに一致するものがない場合、オンライン ラーニング シーケンスはナレッジベースを調べます。

その他のトレーニング可能なロケータ メソッドもトレーニング ドキュメントを収集しますが、これらのドキュメントをナレッジベースにエクスポートすることはできません。そのため、トレーニング ドキュメントをインポートしてプロジェクトを再トレーニングするまで、トレーニング ドキュメントが蓄積されます。

プロジェクトのトレーニング全体を改善するには、次のようにします。

  • トレーニング可能なグループ ロケータからナレッジベースにトレーニング データをエクスポートします。

  • Transformation Designer の [新しいサンプル]頻繁にインポートします。トレーニング ドキュメントのインポートを怠ると、トレーニングの競合や抽出のエラーが発生する可能性が高くなります。

  • [Validation 後に自動トレーニング] 設定を利用します。この設定により、本番中に変更されたドキュメントのみが、収集されるドキュメントになります。

  • フィールド プロパティの [トレーニング ダイアログに表示] 設定と、[ドキュメントを編集] ウィンドウの [トレーニング セットに追加] 設定を使用します。これらの設定により、トレーニングに使用されるフィールドが監視され、正しくトレーニングされます。