フィールド抽出のテスト
あらゆるドキュメント タイプを対象にフィールド抽出をテストするには、このトピックの手順を使用します。分類テストと抽出テストの両方に同じテスト ドキュメントが使用されます。
フィールド抽出をテストしておくことで、本番環境で良好な結果が得られます。フィールドにフォーマッタまたはバリデータが適用されている場合、それらを反映した形で抽出結果が表示されるため、本番環境でどのようにオペレータに表示されるかを事前に把握できます。
トレーニング ドキュメントにはプレーンなサムネイル イメージがあり、テスト ドキュメントにはサムネイル イメージ上にテストの ボタンがあります。
開始する前に
フィールド抽出をテストする前に、次の手順が完了していることを確認します。
手順
- ([フィールド]) メニューを選択します。
- ドキュメント タイプを選択します。
-
テスト ドキュメントを選択し、 ([テスト]) を選択します。
抽出が実行され、フィールド抽出結果が [フィールド] タブに表示されます。フォーマット設定と検証が構成されている場合、抽出結果には、その両方が反映されます。抽出データの円の色は検証エラーを示すものではありません。抽出データの円が緑色でも、検証に失敗した無効な結果である可能性があります。
抽出データの円は、次のいずれかの結果に該当します。各アイコンのヒントには、元の値や検証メッセージ (該当する場合) など、フィールド抽出の詳細情報が表示されます。ドキュメント ビューアのフィールドのヒントにも、フォーマットされた値が表示されます。
アイコン
説明

テスト中に値が見つかりませんでした。

フィールドは高品質かつ高い信頼度で抽出されます。

フィールドは品質と信頼度が低い状態で抽出されます。
-
フィールドが期待どおりに抽出されない場合は、テスト ドキュメントをトレーニング ドキュメントと比較し、次の 1 つ以上の操作を実行します。
-
両方のドキュメントのフィールド ラベルが異なる場合は、トレーニング ドキュメントのフィールド上のキーワード リストに新しいラベルを追加します。
-
ドキュメントのレイアウトに一貫性がない場合は、複数のテスト ドキュメントに対し、それぞれの位置で同じフィールドを追加するようにします。
また、このレイアウトのドキュメントをこのドキュメント タイプのトレーニング ドキュメントとして追加することを検討してください。プロジェクトをトレーニングした後、抽出を再度テストします。
-
抽出された値が想定と異なる場合は、フィールドが適切なタイプとフォーマッタで構成されており、適切な長さと文字の制限があることを確認します。
-
制限が厳しくなりすぎないようバリデータを見直します。検証ルールを満たさないフィールドには無効のフラグが付けられ、本番環境で検証オペレータによる確認が必要になります。
-
- フィールドの設定を更新したら、もう一度 ([テスト]) を実行します。
- 他のテスト ドキュメントおよびドキュメント タイプについても、抽出結果が要件を満たすまで手順 2 ~ 5 を繰り返します。
次のステップ
-
インポート チャネルを構成します。
-
オプション。ソリューションを公開します。