トレーニング可能なグループ ロケータ
[トレーニング可能なグループ ロケータ] は、使用できる範囲の広いトレーニング可能なロケータです。他の 3 つのグループ ロケータは、請求書ドキュメントおよび関連フィールド専用のグループ ロケータです。[トレーニング可能なグループ ロケータ] には、他のグループ ロケータでは扱うことのできない 1~30 個の追加サブフィールドを設定できます。
最良の結果を得るためには、1 つの [トレーニング可能なグループ ロケータ] で構成するすべてのフィールドがまとまっていることを確認してください。フィールドは通常、同じページ上において同じブロック内の互いに近い位置に配置されています。複数のまとまったフィールドを抽出するには、[トレーニング可能なグループ ロケータ] の複数インスタンスを使用します。同一の [トレーニング可能なグループ ロケータ] 内で、関係のない多くのフィールドをまとめて構成した場合。構成済みかつトレーニング済みのフィールドが、トレーニング済みのドキュメントと同じ関係で検出されることがロケータの抽出基準となるため、抽出率が低くなります。トレーニング済みのフィールドがない場合、または同じページあるいは異なるページの別の位置に移動すると、抽出品質が低下します。
[トレーニング可能なグループ ロケータ] は、ドキュメントの同じページからのみサブフィールドを抽出します。ロケータでは、サブフィールド間の改ページを使用できません。
次の例では、[トレーニング可能なグループ ロケータ] を使用する場合のさまざまなインスタンスについて説明します。
3 つのグループ ロケータでは抽出できない請求書フィールドを使用している国も多くあります。例:
商品の納品に関連するフィールド:
-
納品書番号
-
納品日
支払い条件および対応する割引に関連するフィールド:
-
割引対象日
-
割引日数
-
割引率
-
割引合計
保険会社や銀行のプロジェクトでは、契約、口座、または保険番号を抽出する必要があることも少なくありません。これらの数値には明確に定義された形式が使用されており、多くの場合、その近くに判断に役立つ単語があります。例:
契約番号: 12345/678
[トレーニング可能なグループ ロケータ] は、次のように管理します。
-
サブフィールドを管理する
-
トレーニング タイプを定義する
-
弱いキーワードを定義する
トレーニング可能なグループ ロケータのプロパティ ウィンドウ には次のタブがあります。