抽出ベンチマークの実行

抽出ベンチマークを生成する前に、[ドキュメント] ウィンドウでゴールデン ファイルまたはベンチマーク ドキュメント セット開く必要があります。

抽出ベンチマークを実行した後で、抽出構成の設定の変更が必要となる場合があります。しかし、以下のような設定は一般的に避ける必要があります。

  • 緑の有効フィールドを取得するという目的で最小信頼度値を下げる。その結果、無効なデータを見逃す可能性があります。

  • 赤の不正確な有効フィールドを削除するという目的で最小信頼度値を上げる。これは、不正確な有効フィールドの原因となる問題をマスクするだけで解決にはならないためです。これらのタイプのエラーが本番環境でも発生してしまう恐れがあります。

  • 特定のフィールドを改善するために認識プロファイルの設定を変更する。これは、他のロケータ メソッドおよびフィールドに悪影響を及ぼす可能性があります。

このような設定を行う代わりに、以下のことを確実に行う必要があります。

  • 使用する認識エンジンがドキュメントに対して最も効果的であるかどうかを確認する。

  • 分類結果を改善して、抽出結果に悪影響が及ばないようにする。

  • [形式ロケータ] で使用する正規表現を改善する。

  • [アドバンスト ゾーン ロケータ] の画像クリーンアップ、アンカリング、登録などのゾーン設定を確認および更新する。

  • プロジェクト レベルおよびクラス レベルで使用するスクリプトを確認し、改善する。

  • すべてのデータベースが最新であること、およびクエリによって正しいデータが返されることを確認する。

  • 通常のトレーニング可能なテーブルのテーブル ロケータ設定を確認し、改善する。

  • 抽出結果が改善される可能性のあるその他のロケータ固有の設定を更新する。

抽出ベンチマークを実行できます以下の手順に従って、設定します。

  1. [ドキュメント] ウィンドウを 開きます (まだ開いていない場合)。
  2. 別のビューが使用されている場合は、[リスト表示] [ドキュメント ウィンドウ] - [フラット ビュー] アイコン切り替えます。
  3. 抽出テスト用に作成したゴールデン ファイルを開きます
  4. [プロセス] タブの [ベンチマーク] グループで、[抽出ベンチマーク] [ベンチマーク] - [抽出] アイコン をクリックし、サブメニューから次の設定のいずれかを選択します。
    • [抽出ベンチマーク (選択されたクラスのみ)] [ベンチマーク] - [抽出選択されたクラス] アイコン

    • [抽出ベンチマーク (選択されたクラスおよび子クラス)] [ベンチマーク] - [抽出選択されたクラスおよび子] アイコン

    • [抽出ベンチマーク (すべてのクラス)] [ベンチマーク] - [抽出すべてのクラス] アイコン

    [抽出ベンチマーク] ウィンドウが表示され、選択した抽出ベンチマークが実行されます。

  5. このウィンドウ以外で変更を加えた場合は、[開始] をクリックして別のベンチマークを実行します。

    抽出ベンチマークの結果が、[サマリー] テーブルと [詳細] テーブルに表示されます。

  6. 必要に応じて、[保存] をクリックして、後で比較できるようにベンチマーク結果を保存します。
  7. 必要に応じて、別のアプリケーションで開くことができる .csv ファイルとして、ベンチマーク結果を [エクスポート] します。