抽出の設定

Kofax TotalAgility の主な目的の 1 つは、ドキュメントからデータを抽出することです。抽出されたデータはフィールドに格納されます。フィールドとフィールド抽出定義は、Transformation Designer で設定されます。

Kofax TotalAgility は、未分類のドキュメントの抽出は実行しません。したがって、成功した分類が存在することが重要になります。

Kofax TotalAgility は、2 つのステップを実行して抽出を実行します。

  1. ドキュメント上でデータの場所を探す

  2. 場所アルゴリズムの結果を 1 つ以上のフィールドに割り当てる

ドキュメント上でアイテムの場所を探すこれらのメソッドは、ロケータと呼ばれる標準化されたエンジンに実装されています。この 2 ステップ プロセスは、再利用可能なロケータ コンポーネントと明確な抽出構成方針を提供します。本番環境での実行中、Kofax TotalAgility は複数のロケータを使用して 1 つのフィールドを検出できるほかに、1 つのロケータから複数のフィールドにデータを入力することもできます。この機能は、ロケータの順序が非常に重要であることを意味します。必要に応じて、ロケータを再配置します。

Kofax TotalAgility には、一連の事前定義された抽出メソッドが付属しています。これらのメソッドを使用して、カスタマイズされたロケータを作成します。または、スクリプト プラグインを指定して、独自のカスタム ロケータを追加します。

フィールドはプロジェクト レベルで定義できます。フィールドの内容は分類の最初に抽出されます。これらのフィールドの抽出結果は、ドキュメントを分類するために使用できます。たとえば、バーコードに基づいてドキュメントを分類するか、分類ロケータを使用して言語依存の分類を実行します。ロケータの結果は、プロジェクト レベルのフィールドに保存されます。クラスのフィールドを定義した場合、サブクラスはフィールドの定義を継承されます。サブクラスでは、基本クラスから継承した定義を使用するか、フィールドの抽出メソッドを変更します。

Transformation Designer で使用可能な一部のロケータを本番環境で使用するには、別途ライセンスが必要です。これらのロケータの 1 つを使用するようにプロジェクトを構成した場合は、必要なライセンスが利用可能な場合を除き、Transformation Server は起動しません。

ライセンスのない機能を含むプロジェクトを基にしたコンテンツはすべて拒否されます。

抽出を設定するには、以下の手順に従って、設定します。

  1. [プロジェクト ツリー] でプロジェクト階層を展開し、構成するクラスにあるアイテムを [表示] します。

    選択したクラスのロケータとフィールドを含む、すべてのクラス アイテムのリストが表示されます。

  2. 必要に応じて、新しいロケータ メソッドを追加して構成します。
  3. 必要に応じて、既存のロケータ メソッドを変更します。
  4. 必要に応じて、選択したロケータ メソッドの新しいフィールドを追加します。
  5. 必要に応じて、選択したロケータ メソッドの既存のフィールドを変更します。
  6. ドキュメント セット内の複数のドキュメントを使用して、ロケータ メソッドをテストします。
  7. 必要に応じて、抽出ベンチマークを生成して、テスト結果を比較します。
  8. 変更のテストが終了したら、プロジェクトを閉じます。