テキスト コンテンツ ロケータ のトレーニング

[テキスト コンテンツ ロケータ] をトレーニングする前に、[テキスト コンテンツ ロケータ] サブフィールドクラス フィールドをプロジェクトに追加します。フィールドの追加が完了してから、トレーニング ドキュメントを追加してプロジェクトをトレーニングします。

[テキスト コンテンツ ロケータ] をトレーニングするには以下の手順に従って、設定します。

  1. [プロジェクト ツリー] ウィンドウを 開きます (まだ開いていない場合)。
  2. [プロジェクト ツリー] を展開し、クラスを選択します。
  3. 表示されていないクラス コンテンツは、必要に応じて表示します。

    非表示のクラス コンテンツが表示されます。

  4. [ドキュメント] ウィンドウを 開きます (まだ開いていない場合)。
  5. 別のビューが使用されている場合は、[リスト表示] [ドキュメント ウィンドウ] - [フラット ビュー] アイコン切り替えます。
  6. [テキスト コンテンツ ロケータ] のトレーニングに使用するドキュメントを含むドキュメント セットを追加するか、開きます。

    ドキュメントのリストが表示されます。

  7. ドキュメントをダブルクリックします。

    [ドキュメント ビューア] に、選択したドキュメントが表示されます。

  8. ドキュメントがトレーニングに適したものである場合は、[ドキュメント] ウィンドウのリスト ビューでそのドキュメントを選択し、メニューから [選択したクラスのトレーニング セットに追加 (抽出)] [抽出用にトレーニング] アイコン を選択します。

    最初に選択したドキュメントが表示された [ドキュメントを編集] ウィンドウが開きます。

  9. [ドキュメントを編集] ウィンドウでフィールドを選択し、ドキュメント内の対応するコンテンツを選択します。

    選択データがフィールドに入力されます。

  10. それぞれのフィールドで選択を繰り返し、完了してから [トレーニング セットに追加] をクリックします[トレーニング フォルダに追加] アイコン

    ドキュメントが [抽出セット] に追加され、ドキュメント セット内の次のドキュメントが自動的に読み込まれます。

  11. トレーニング セットのテストの準備が整うまでトレーニング ドキュメントを追加し、[ドキュメントを編集] ウィンドウを [閉じる] をクリックして終了します。

    プロジェクトをトレーニングおよびテストする前に、テストの最初の反復用としてクラスごとに最低 3~5 のトレーニング ドキュメントを追加します。トレーニング ドキュメントの最小数を使用すると、信頼度の高い抽出結果が返されます。また、その少数のドキュメントが適切な結果を返す場合は、ドキュメントを追加する必要はありません。

  12. [プロセス] リボン タブで、[トレーニング] グループから [抽出] をクリックします[トレーニング] - [抽出] アイコン

    トレーニング セット内のドキュメントのトレーニングを実行し、進行状況バーで進行状況を確認します。

  13. テスト ドキュメント セットで、選択した 1 つ以上のドキュメントを右クリックし、[プロセス] をクリックします。

    ドキュメントが分類され、抽出されます。

  14. [抽出結果] ウィンドウを 開きます (まだ開いていない場合)。

    抽出結果が表示されます。無効なフィールドには青の疑問符が付き、有効なフィールドには緑のチェック マークが付きます。

  15. [抽出結果] ウィンドウで、トレーニングド キュメントに基づいた [テキスト コンテンツ ロケータ] の結果を表示します。

    適切な結果が得られない場合は、ステップ 7~14 を繰り返してトレーニング ドキュメントを [抽出セット] に追加します。