[トレーニング可能なエバリュエータ] のトレーニング
このエバリュエータをトレーニングすることで、そのロケータ自体をトレーニングできない場合でも、プロジェクトによる学習を通じて入力ロケータから最善の結果を抽出できます。たとえば、ドキュメントの顧客番号を、[形式ロケータ] を使用して抽出することができます。形式ロケータ自体はトレーニングできません。
[トレーニング可能なエバリュエータ] には、入力ロケータ用のサブフィールドがあります。入力ロケータのすべての候補がテストされ、既存のトレーニング ドキュメントに基づいて最も信頼度の高い候補が返されます。最良の結果を得るには、トレーニングする情報ごとに 5 つ以上の理想的なトレーニング ドキュメントを追加します。1 つのドキュメントに複数のサブフィールドのデータが含まれる場合、個々のサブフィールドごとにトレーニング ドキュメントを用意するは必要ありません。
[トレーニング可能なエバリュエータ] をトレーニングできます以下の手順に従って、設定します。
- [プロジェクト ツリー] ウィンドウを [開きます] (まだ開いていない場合)。
- [プロジェクト ツリー]を展開し、以下を選択: クラス。
-
表示されていないクラス コンテンツは、必要に応じて表示します。
非表示のクラス コンテンツが表示されます。
- [ドキュメント] ウィンドウを [開きます] (まだ開いていない場合)。
-
別のビューが使用されている場合は、[リスト ビュー]
に切り替えます。
-
[トレーニング可能なエバリュエータ] のトレーニングに使用するドキュメントを含むドキュメント セットを追加するか、開きます。
ドキュメントのリストが表示されます。
-
ドキュメントをダブルクリックします。
[ドキュメント ビューア] に、選択したドキュメントが表示されます。
-
ドキュメントがトレーニングに適したものである場合は、[ドキュメント] ウィンドウのリスト表示でそのドキュメントを選択し、メニューから [抽出用にトレーニング] を選択します
。
選択したドキュメントが表示された [ドキュメントを編集] ウィンドウが開きます。
-
[ドキュメントを編集] ウィンドウでフィールドを選択し、ドキュメント内の対応するコンテンツを選択肢ます。
選択データがフィールドに入力されます。
-
それぞれのフィールドで選択を繰り返し、完了してから トレーニング セットに追加 をクリックします
。
ドキュメントが [抽出セット] に追加され、ドキュメント セット内の次のドキュメントが自動的に読み込まれます。
注 ドキュメント セットに追加のドキュメントがある場合は、最初のドキュメントを処理すると [ドキュメントを編集] ウィンドウに自動的にロードされます。このクラスの抽出トレーニング セットにその他のドキュメントを追加しない場合は、[ドキュメントを編集] ウィンドウを閉じます。 -
トレーニング セットのテストの準備が整うまでトレーニング ドキュメントを追加し、[ドキュメントを編集] ウィンドウを [閉じる] をクリックして終了します。
-
[プロセス] リボン タブで、[トレーニング] グループから [抽出] をクリックします
。
トレーニング セット内のドキュメントのトレーニングを実行し、進行状況バーで進行状況を確認します。
-
テスト ドキュメント セットで、選択した 1 つ以上のドキュメントを右クリックし、[プロセス] をクリックします。
ドキュメントが分類され、抽出されます。
-
[抽出結果] ウィンドウを [開きます] (まだ開いていない場合)。
抽出結果が表示されます。無効なフィールドには青の疑問符が付き、有効なフィールドには緑のチェック マークが付きます。
-
[抽出結果] ウィンドウで、トレーニング ドキュメントに基づいた [トレーニング可能なエバリュエータ] の結果を確認します。
適切な結果が得られない場合は、ステップ 7~14 を繰り返してトレーニング ドキュメントを [抽出セット] に追加します。