フィールド抽出のテスト

あらゆるドキュメント タイプを対象にフィールド抽出をテストするには、このトピックの手順を使用します。分類テストと抽出テストの両方に同じテスト ドキュメントが使用されます。

フィールド抽出をテストしておくことで、本番環境で良好な結果が得られます。フィールドにフォーマッタまたはバリデータが適用されている場合、それらを反映した形で抽出結果が表示されるため、本番環境でどのようにオペレータに表示されるかを事前に把握できます。

トレーニング ドキュメントにはプレーンなサムネイル イメージがあり、テスト ドキュメントにはサムネイル イメージ上にテストの ボタンがあります。

開始する前に

フィールド抽出をテストする前に、次の手順が完了していることを確認します。

手順

  1. ([フィールド]) メニューを選択します。
  2. ドキュメント タイプを選択します。
  3. テスト ドキュメントを選択し、 ([テスト]) を選択します。

    抽出が実行され、フィールド抽出結果が [フィールド] タブに表示されます。フォーマット設定と検証が構成されている場合、抽出結果には、その両方が反映されます。抽出データの円の色は検証エラーを示すものではありません。抽出データの円が緑色でも、検証に失敗した無効な結果である可能性があります。

    抽出データの円は、次のいずれかの結果に該当します。各アイコンのヒントには、元の値や検証メッセージ (該当する場合) など、フィールド抽出の詳細情報が表示されます。ドキュメント ビューアのフィールドのヒントにも、フォーマットされた値が表示されます。

    アイコン

    説明

    灰色のトレーニング円形アイコン

    テスト中に値が見つかりませんでした。

    緑のトレーニング円形アイコン

    フィールドは高品質かつ高い信頼度で抽出されます。

    オレンジ色のトレーニング円形アイコン

    フィールドは品質と信頼度が低い状態で抽出されます。

  4. フィールドが期待どおりに抽出されない場合は、テスト ドキュメントをトレーニング ドキュメントと比較し、次の 1 つ以上の操作を実行します。
    • 両方のドキュメントのフィールド ラベルが異なる場合は、トレーニング ドキュメントのフィールド上のキーワード リストに新しいラベルを追加します。

    • ドキュメントのレイアウトに一貫性がない場合は、複数のテスト ドキュメントに対し、それぞれの位置で同じフィールドを追加するようにします。

      また、このレイアウトのドキュメントをこのドキュメント タイプのトレーニング ドキュメントとして追加することを検討してください。プロジェクトをトレーニングした後、抽出を再度テストします。

    • 抽出された値が想定と異なる場合は、フィールドが適切なタイプとフォーマッタで構成されており、適切な長さと文字の制限があることを確認します。

    • 制限が厳しくなりすぎないようバリデータを見直します。検証ルールを満たさないフィールドには無効のフラグが付けられ、本番環境で検証オペレータによる確認が必要になります。

  5. フィールドの設定を更新したら、もう一度 ([テスト]) を実行します。
  6. 他のテスト ドキュメントおよびドキュメント タイプについても、抽出結果が要件を満たすまで手順 2 ~ 5 を繰り返します。

次のステップ