[トレーニング可能なエバリュエータ] のトレーニング

このエバリュエータをトレーニングすることで、そのロケータ自体をトレーニングできない場合でも、プロジェクトによる学習を通じて入力ロケータから最善の結果を抽出できます。たとえば、ドキュメントの顧客番号を、[形式ロケータ] を使用して抽出することができます。形式ロケータ自体はトレーニングできません。

[トレーニング可能なエバリュエータ] には、入力ロケータ用のサブフィールドがあります。入力ロケータのすべての候補がテストされ、既存のトレーニング ドキュメントに基づいて最も信頼度の高い候補が返されます。最良の結果を得るには、トレーニングする情報ごとに 5 つ以上の理想的なトレーニング ドキュメントを追加します。1 つのドキュメントに複数のサブフィールドのデータが含まれる場合、個々のサブフィールドごとにトレーニング ドキュメントを用意するは必要ありません。

[トレーニング可能なエバリュエータ] をトレーニングできます以下の手順に従って、設定します。

  1. [プロジェクト ツリー] ウィンドウを [開きます] (まだ開いていない場合)。
  2. [プロジェクト ツリー]を展開し、以下を選択: クラス。
  3. 表示されていないクラス コンテンツは、必要に応じて表示します。

    非表示のクラス コンテンツが表示されます。

  4. [ドキュメント] ウィンドウを [開きます] (まだ開いていない場合)。
  5. 別のビューが使用されている場合は、[リスト ビュー] [ドキュメント ウィンドウ] - [フラット ビュー] アイコン切り替えます。
  6. [トレーニング可能なエバリュエータ] のトレーニングに使用するドキュメントを含むドキュメント セットを追加するか、開きます。

    ドキュメントのリストが表示されます。

  7. ドキュメントをダブルクリックします。

    [ドキュメント ビューア] に、選択したドキュメントが表示されます。

  8. ドキュメントがトレーニングに適したものである場合は、[ドキュメント] ウィンドウのリスト表示でそのドキュメントを選択し、メニューから [抽出用にトレーニング] を選択します[抽出用にトレーニング] アイコン

    選択したドキュメントが表示された [ドキュメントを編集] ウィンドウが開きます。

  9. [ドキュメントを編集] ウィンドウでフィールドを選択し、ドキュメント内の対応するコンテンツを選択肢ます。

    選択データがフィールドに入力されます。

  10. それぞれのフィールドで選択を繰り返し、完了してから トレーニング セットに追加 をクリックします[トレーニング フォルダに追加] アイコン

    ドキュメントが [抽出セット] に追加され、ドキュメント セット内の次のドキュメントが自動的に読み込まれます。

    ドキュメント セットに追加のドキュメントがある場合は、最初のドキュメントを処理すると [ドキュメントを編集] ウィンドウに自動的にロードされます。このクラスの抽出トレーニング セットにその他のドキュメントを追加しない場合は、[ドキュメントを編集] ウィンドウを閉じます。
  11. トレーニング セットのテストの準備が整うまでトレーニング ドキュメントを追加し、[ドキュメントを編集] ウィンドウを [閉じる] をクリックして終了します。
  12. [プロセス] リボン タブで、[トレーニング] グループから [抽出] をクリックします[トレーニング] - [抽出] アイコン

    トレーニング セット内のドキュメントのトレーニングを実行し、進行状況バーで進行状況を確認します。

  13. テスト ドキュメント セットで、選択した 1 つ以上のドキュメントを右クリックし、[プロセス] をクリックします。

    ドキュメントが分類され、抽出されます。

  14. [抽出結果] ウィンドウを [開きます] (まだ開いていない場合)。

    抽出結果が表示されます。無効なフィールドには青の疑問符が付き、有効なフィールドには緑のチェック マークが付きます。

  15. [抽出結果] ウィンドウで、トレーニング ドキュメントに基づいた [トレーニング可能なエバリュエータ] の結果を確認します。

    適切な結果が得られない場合は、ステップ 7~14 を繰り返してトレーニング ドキュメントを [抽出セット] に追加します。