Azure AI Document Intelligence からの応答を使用したドキュメントの作成
Azure AI は、クラウド製品の一部として Document Intelligence サービスを提供しています。
Document Intelligence には、さまざまなドキュメント タイプからさまざまなタイプのデータを抽出するように特別に設計された、事前構築済みの複数のモデルが用意されています。Document Intelligence はカスタム モデルにも対応します。
OCR 応答には、プロセッサに固有の名前付きフィールドのコレクションとプロセッサで検出された内容が含まれます。
\\TotalAgilityInstall\Sample Processes\Third Party Data Extraction にあるサンプル パッケージ Azure AI Document Intelligence Package.zip を TotalAgility Designer にインポートします。
サンプル パッケージには以下のものが含まれています。
カテゴリ |
[データ抽出] > [Azure AI Document Intelligence] パッケージ内のすべてがこのカテゴリに追加されます。 |
プロセス |
|
抽出グループ | ThirdPartyExtraction: この抽出グループには、いくつかのサンプル ドキュメント タイプが含まれています。 |
分類グループ | ThirdPartyExtractionCG |
スキャン/VRS プロファイル | サードパーティのデータ抽出プロファイル |
グローバル データ モデル |
|
フォーム | スキャン新規ジョブ作成と検証フォーム。 |
サンプル プロセス: AzureAI 領収書
このサンプル プロセスでは、API バージョン 3.1 2023-07-31 を使用して、事前構築済みの領収書モデルを使用して返されるフィールドにデータを入力する方法が示されます。「領収書データの抽出 - Document Intelligence (旧称 Form Recognizer) - Azure AI サービス | Microsoft Learn」を参照してください。
このサンプル プロセスには次のアクティビティが含まれています。
アクティビティ | 説明 |
---|---|
Azure AI 抽出 | プロセス内で JSON を使用してデータ オブジェクトを設定します。JSON は、coffee-chain-receipt-sample.jpg イメージに対する AzureAI からのサンプル応答に対応します。(実際の作業シナリオでは、これにより Azure AI が呼び出されます) |
領収書抽出結果の処理 | JSON から領収書データを取得し、TotalAgility ドキュメントのフィールドに値を設定します。 |
生データの消去 | 生の JSON とデータ オブジェクトは不要になるので削除します。 |
検証 | ドキュメントを検証します。 |
実行時にこの検証を試行するには、次の手順を実行します。
-
AzureAI Receipt_Scan.form を参照します。
-
Coffee-chain-receipt-sample.jpg イメージをスキャンします。
このサンプル プロセスは、このイメージのみで動作するように構成されています。
-
プロセスのジョブを作成します。
-
作業キューを選択し、[検証] アクティビティをクリックします。
ドキュメント フィールドのデータが表示されます。フィールドをクリックすると、ドキュメント イメージ上の領域が強調表示されます。
-
必要に応じて、ドキュメントの各フィールドを検証できます。
-
[はい] をクリックして検証を完了します。
サンプル プロセス: AzureAI 運転免許証
このプロセスは、Azure AI 領収書プロセスに似ていますが、フィールドは運転免許証のドキュメント タイプによって異なります。
スキャン フォームは AzureAI Driving License_Scan.form で、スキャンするイメージは laura-wilson-driving-license-sample.jpg です。
このサンプル プロセスは、このイメージのみで動作するように構成されています。