抽出の新しいサンプルのインポート
[新しいサンプル] ドキュメント セットで抽出の新しいサンプルを表示した後に、これらのドキュメントによって抽出結果を改善できる場合は、これらを [抽出セット] に追加できます。サンプルが抽出トレーニングに適していない場合は、[新しいサンプル] [抽出] ドキュメント サブセットから削除します。
1 つ以上の抽出の新しいサンプルをインポートできます。以下の手順に従って、設定します。
- [ドキュメント] ウィンドウを 開きます (まだ開いていない場合)。
- [新しいサンプル] ドキュメント サブセットを選択します。
-
[抽出] ドキュメント サブセットを選択します。
抽出サンプルのリストが表示されます。
- すべての抽出サンプルが一度にインポートされるため、抽出トレーニングに適していないドキュメントをレビューして、削除することをお勧めします。
-
[ドキュメント] ツールバーで、[抽出オンライン ラーニングからドキュメントをインポート] をクリックします。
[抽出オンライン ラーニング データをインポート] ウィンドウが表示され、プロジェクトのオンライン ラーニング ファイルの現在のパスが表示されます。
-
[新しい抽出セット サブセットにインポート] フィールドに名前を入力します。
インポートされた新しいサンプル ドキュメント セットごとに新しいドキュメント サブセットを作成することをお勧めします。こうすることで、トレーニング セットを区別、テスト、およびベンチマークして、特定の新しいサンプル セットによって抽出結果が改善されるか否かを判断できるからです。
-
[OK] をクリックして設定を保存し、[抽出オンライン ラーニング データをインポート] ウィンドウを閉じます。
[新しいサンプル] データベースの [抽出] サブセットが空になり、すべての抽出サンプルとこれらが前のステップで指定したドキュメント サブセットの下の [抽出セット] に移動されます。
- 抽出のためにプロジェクトをトレーニングします。
- 必要に応じて、抽出ベンチマークを実行し、新しく追加されたサンプル ドキュメントを含まない以前のベンチマークと比較します。