推測または推論によるフィールド

これらはドキュメントに印刷されないフィールドですが、利用可能な情報に基づいて、ロケータがその情報を抽出できる場合があります。抽出されたデータはドキュメントに印刷されないため、強調表示された結果は必ずしもドキュメント上の有用な場所に対応するとは限りません。

推測フィールドの抽出が正常に機能しないこともあります。自動抽出は、ドキュメントからの認識結果のみに基づいてデータを抽出するように設計されています。したがって、必要な推論が多くなるほど、ドキュメント内のデータがわかりにくくなり、データが正常に導き出される可能性は低くなります。

たとえば、公共料金の請求書があり、公共料金の種類を知りたいとします。この情報は必ずしもドキュメントに印刷されているわけではありませんが、ドキュメントに印刷されている情報に基づいて推測できる場合があります。電力、ワット数、下水などの言葉は、公共料金の種類を判断するのに役立ちます。

サブフィールド名:公共料金タイプ

説明: 請求書の公共料金タイプ。ガス、電気、水道のいずれかになります。値が見つからない場合は、Unknown を返します。

1 枚の請求書に公共料金の種類が複数記載されている場合、これは正しく機能しません。1 つのフィールドが 2 つの異なる情報を返すことはできません。公共料金の種類は、フォームにリストされている最初の種類が常に返され、それ以降は無視されます。

他にも次のような推定フィールドが考えられます。

  • ドキュメントの言語。

  • 国名 (ドキュメントに印刷されている住所に国名がない場合)。ここでは、必要なだけ具体的に指定できます。たとえば、3 文字の ISO 国コードを使用する場合は、説明にその旨を指定します。

    通貨も国と同様です。これは記号またはコードになります。説明に求める内容を正確に指定してください。

  • ドキュメントで参照されている個人のタイム ゾーン。

たとえば、ドキュメントの未払い金額を抽出し、出力に通貨記号を含めるとします。記号も国名もドキュメントに印刷されていなくても、ドキュメントに印刷されている情報からこの情報を推測できる場合があります。

サブフィールド名: 未払い金額

説明: ドキュメントに記載されている未払い金額。請求書の受取人が居住する国の通貨記号を返し、結果に小数点以下 2 桁を含めます。

以下は、説明と推測情報を使用して書式設定する方法の例です。

  • 口座名義人の国の 3 文字の国コード。

  • この請求書で支払われる税額の合計。結果には、請求書の受取人が居住する国の通貨記号と、小数点以下 3 桁が含まれる必要があります。

  • 請求書受取人のタイム ゾーン。タイム ゾーンのフルネームを使用し、フルネームの後に括弧で囲んだコードを付けます。

あらゆる説明と同様に、テストを通じて表現を試してみてください。

関連トピック: