抽出セット
抽出結果を確実に改善する方法の 1 つは、抽出用のトレーニング ドキュメントを提供することです。
このドキュメント セットには、抽出トレーニングで使用されるすべてのドキュメントが格納されています。[抽出セット] は、[分類結果] と同様に、プロジェクトが作成され、必要に応じてドキュメントを追加する準備ができた時点で自動的に作成されます。このドキュメント セットは、リスト表示とサムネイル ビューでのみ使用できます。
[抽出セット] には、プロジェクトで定義されたクラスに適した抽出結果を含む、理想的なサンプルとなるドキュメントが格納されています。
ドキュメント セットを使用しない、以前のバージョンの Transformation Designer で作成されたプロジェクトの場合、既存の [抽出セット] は新しいドキュメント セット形式に変換されます。つまり、古いトレーニング ドキュメントが失われることがなく、新しい [抽出セット] にいつでもドキュメントを追加できます。
別のドキュメント セットが抽出セットとして設定されていない場合は、自動的に作成された [分類結果] をプロジェクトから削除できません。つまり、意味のあるディレクトリ別に編成された既存のドキュメント セットがある場合、それを新しいドキュメント セットとして追加し、[抽出セット] に設定できます。必要に応じて、元のトレーニング セットを削除できます。
[抽出セット] は次の方法で管理できます。
-
[抽出セット] 内のドキュメント サブセットにドキュメントを追加する
-
[抽出セット] を整理するのに役立つドキュメント サブセットを追加する
-
選択したクラスの [抽出セット] にドキュメントを追加する
-
[抽出セット] からドキュメント サブセットまたはドキュメントを削除する
-
列データに基づいてドキュメントを並べ替える
-
分類結果に基づいてドキュメントをフィルタするか、カスタム フィルタを追加してドキュメントをフィルタする
-
トレーニング データの競合の解決する