トレーニング可能なエバリュエータ

[トレーニング可能なエバリュエータ] アイコン 比較的小さなトレーニング セットで汎用の抽出結果を迅速に高い精度で取得する必要がある場合は、高度な最適化を行ったトレーニング可能なエバリュエータを使用します。このエバリュエータは、他のロケータからの候補を比較して、それらの候補の中から特定の基準のセットに一致するものを判断するために使用します。このエバリュエータは、入力ロケータからの候補の内容に依存します。また、誤った候補から学習を行って、トレーニングを改善します。

入力ロケータは、それぞれのサブフィールドに候補セットを返します。トレーニング可能なエバリュエータは、トレーニング データを使用して、割り当てられたサブフィールドに対して最善の結果となる入力ロケータの代替セットを確認します。

入力ロケータは入力値を返しますが、この動作はトレーニング中および抽出中に実行されるため、複雑になりすぎないようにする必要があります。

たとえば、プロジェクトに、ドキュメントで見つかったすべての金額を返す形式ロケータが含まれているとします。その形式ロケータをトレーニング可能なエバリュエータへの入力として使用し、形式ロケータの金額候補から 「合計」 を見つけるようにトレーニングできます。

クラス内のロケータのリストにおけるトレーニング可能なエバリュエータの位置はとても重要です。入力ロケータとして使用できるのは、トレーニング可能なエバリュエータの上にリストされているロケータのみです。サブフィールドは互いに独立しているため、サブフィールドの順序は処理方法には影響しません。これは、サブフィールドをどのような順序で編成しても出力には影響を及ぼさないことを意味します。

入力ロケータは単純ロケータとする必要があります。テーブル ロケータまたはグループ ロケータを入力ロケータとして使用することはできません。

このエバリュエータは、すぐに使用可能な事前トレーニング済みの汎用の抽出が必要な場合に最適です。入力ロケータを定義するため、抽出の対象となる候補に多大な影響を及ぼすことになります。これは、入力ロケータとスクリプト イベントの構成および微調整を行うことができるためです。また、トレーニング可能なエバリュエータは少ないサンプルですばやく学習可能なため、多くのトレーニング ドキュメントは必要ありません。

ただし、特定の抽出または完全自動のオンライン ラーニングが必要な場合は、トレーニング可能なグループ ロケータを使用する必要があります。これは、トレーニング可能なグループ ロケータを使用すると、トレーニング ドキュメントがなくてもプロジェクトを展開できるためです。システムはユーザーの変更から学習し、経時的に抽出が改善されます。

トレーニング可能なエバリュエータは、次のように管理します。

  • トレーニング可能なエバリュエータ サブフィールドを追加する

  • トレーニング可能なエバリュエータ サブフィールドを再配置する

トレーニング可能なエバリュエータのプロパティ ウィンドウ には次のタブがあります。