テキスト コンテンツ ロケータ のトレーニング
[テキスト コンテンツ ロケータ] をトレーニングする前に、[テキスト コンテンツ ロケータ] サブフィールドとクラス フィールドをプロジェクトに追加します。フィールドの追加が完了してから、トレーニング ドキュメントを追加してプロジェクトをトレーニングします。
[テキスト コンテンツ ロケータ] をトレーニングするには以下の手順に従って、設定します。
- [プロジェクト ツリー] ウィンドウを 開きます (まだ開いていない場合)。
- [プロジェクト ツリー] を展開し、クラスを選択します。
-
表示されていないクラス コンテンツは、必要に応じて表示します。
非表示のクラス コンテンツが表示されます。
- [ドキュメント] ウィンドウを 開きます (まだ開いていない場合)。
-
別のビューが使用されている場合は、[リスト表示]
に切り替えます。
-
[テキスト コンテンツ ロケータ] のトレーニングに使用するドキュメントを含むドキュメント セットを追加するか、開きます。
ドキュメントのリストが表示されます。
-
ドキュメントをダブルクリックします。
[ドキュメント ビューア] に、選択したドキュメントが表示されます。
-
ドキュメントがトレーニングに適したものである場合は、[ドキュメント] ウィンドウのリスト ビューでそのドキュメントを選択し、メニューから [選択したクラスのトレーニング セットに追加 (抽出)]
を選択します。
最初に選択したドキュメントが表示された [ドキュメントを編集] ウィンドウが開きます。
-
[ドキュメントを編集] ウィンドウでフィールドを選択し、ドキュメント内の対応するコンテンツを選択します。
選択データがフィールドに入力されます。
-
それぞれのフィールドで選択を繰り返し、完了してから [トレーニング セットに追加] をクリックします
。
ドキュメントが [抽出セット] に追加され、ドキュメント セット内の次のドキュメントが自動的に読み込まれます。
-
トレーニング セットのテストの準備が整うまでトレーニング ドキュメントを追加し、[ドキュメントを編集] ウィンドウを [閉じる] をクリックして終了します。
プロジェクトをトレーニングおよびテストする前に、テストの最初の反復用としてクラスごとに最低 3~5 のトレーニング ドキュメントを追加します。トレーニング ドキュメントの最小数を使用すると、信頼度の高い抽出結果が返されます。また、その少数のドキュメントが適切な結果を返す場合は、ドキュメントを追加する必要はありません。
-
[プロセス] リボン タブで、[トレーニング] グループから [抽出] をクリックします
。
トレーニング セット内のドキュメントのトレーニングを実行し、進行状況バーで進行状況を確認します。
-
テスト ドキュメント セットで、選択した 1 つ以上のドキュメントを右クリックし、[プロセス] をクリックします。
ドキュメントが分類され、抽出されます。
-
[抽出結果] ウィンドウを 開きます (まだ開いていない場合)。
抽出結果が表示されます。無効なフィールドには青の疑問符が付き、有効なフィールドには緑のチェック マークが付きます。
-
[抽出結果] ウィンドウで、トレーニングド キュメントに基づいた [テキスト コンテンツ ロケータ] の結果を表示します。
適切な結果が得られない場合は、ステップ 7~14 を繰り返してトレーニング ドキュメントを [抽出セット] に追加します。