Azure Blob ストレージのエクスポート アクティビティの構成
-
マップにアクティビティを追加します。
デフォルトでは、アクティビティの [プロパティ] パネルで [構成] タブが開きます。
- アクティビティのデフォルトの [名前] を意味のある名前に変更します。
- [タイプ] リストで、 を選択します。
-
以下のプロパティを構成します。
Azure ストレージ TotalAgility [統合] で BLOB 用に構成されている Microsoft Azure ストレージの名前。
Azure ストレージ統合名は、インポート マシンとエクスポート マシンで同一である必要があります。同一でない場合は、エラーが発生します。
入力ソース ファイルがエクスポートされる場所。入力ソースとしてプロセス/サーバー変数を選択します。
変数には、文字列、データ オブジェクト、ドキュメント、フォルダ、Null 許容文字列、または XML を選択することができます。ただし、ドキュメント タイプ変数の場合は、MIME タイプを選択する必要があります。
入力ソースがフォルダ変数の場合、「エクスポート形式」および「フィールド データ形式」プロパティが使用可能になります。
コンテナ名 ファイルがエクスポートされるコンテナの名前。この名前は、動的変数 (プロセス/サーバー) または静的な値です。
エクスポート形式 入力ソースがフォルダ変数の場合は、ファイルを [フォルダ] (デフォルト) または [個別のドキュメント] としてエクスポートします。
フィールド データ形式 次のいずれかの形式でフィールド データ用に作成される BLOB:
-
[CSV] (デフォルト): 抽出されたフィールドを含む CSV ファイルを作成します。
-
JSON: 抽出されたフィールドを含む JSON と生の OCR 結果を作成します。
ファイル形式 JSON フィールド データのファイル形式を選択します。
-
すべてのドキュメントを含む結合ファイル (デフォルト): 個別の複数のドキュメントが 1 つの包括的なファイルに統合されます。
-
各ドキュメントごとに別々のファイル: それぞれのドキュメントが個別のファイルに保存されます。
「ファイル形式」プロパティは、「エクスポート形式」プロパティが「フォルダ」に設定されており、「フィールド データ形式」が「JSON」の場合にのみ使用できます。
BLOB 名 オプション。BLOB の名前を保持する文字列変数。
フォルダ変数が入力ソースとして使用されており、個々のドキュメントに「エクスポート形式」プロパティが設定されている場合は、[BLOB 名] リストで、[ドキュメント ID] または [ファイル名] (デフォルト) を選択します。
BLOB が既に存在する場合 コンテナ内に BLOB が既に存在する場合 (同じファイル名) に実行する必要がある操作を選択します。
-
上書き (デフォルト): 既存の BLOB を上書きします。
-
名前を変更: 既存の名前の末尾に現在のタイムスタンプを追加して、最新の BLOB の名前を変更します。
-
ジョブの一時停止ジョブを一時停止します。
メタデータ メタデータは、キーと値の文字列のペアです。メタデータを設定すると、BLOB の追加情報を保存できます。キーと値のフィールドは、動的 (プロセス/サーバー変数) または静的なタイプをサポートします。
メタデータを追加するには、次の手順を実行します。
-
をクリックします。
-
[キー] ボックスにキーの名前を入力します。
-
[値] ボックスに値に対する値を入力します。
-
[追加] をクリックします。
-
必要に応じて、さらにメタデータを追加します。
メタデータを編集するには、 をクリックして、必要なフィールドを変更します。
メタデータを削除するには、 をクリックします。
インデックス タグ BLOB インデックス タグにより、キーと値のタグ属性を使用してストレージ アカウント内のデータを分類します。
これらのタグは、単一のコンテナ内またはストレージ アカウント内のすべてのコンテナ内のデータを検索するための検索可能な多次元インデックスとして公開されます。
インデックス タグ内のキー フィールドと値フィールドは、大文字と小文字が区別される文字列であり、動的 (プロセス/サーバー変数) または静的な値をサポートします。数字、日付、時刻、または特殊文字が使用されている場合、それらの文字は文字列として保存されます。
インデックス タグには次の文字を含めることができます。
-
小文字 (a-z)
-
大文字 (A-Z)
-
数字 (0-9)
-
スペース (" ")
-
特殊文字 ("+"、"-"、"."、"/"、":"、"="、"_")
BLOB を Azure BLOB ストレージにエクスポートするときに、BLOB にインデックス タグを追加して、タグに基づいて BLOB を検索できるようにすることができます。
インデックス タグを追加するには、次の手順を実行します。
-
をクリックします。
-
[キー] フィールドで、キーの名前を入力します。
キーの最大長は 128 文字です。
-
[値] フィールドで、キーの値を入力します。
値の最大長は 256 文字です。
-
[追加] をクリックします。
-
必要に応じて、さらにインデックス タグを追加します。BLOB には最大で 10 個のタグを追加できます。
インデックス タグを編集するには、 をクリックして、必要なフィールドを変更します。
インデックス タグを削除するには、 をクリックします。
Blob の URL 返される新しい BLOB へのパスを格納するために使用される文字列変数。
-
-
[保存] をクリックします。
実行時に、このアクティビティが処理されると、次のような動作が発生します。
-
異なるタイプの変数ごとに個別の BLOB が作成されます。
フォルダまたはドキュメント変数 文字列、Null 許容文字列、データ オブジェクト、または XML 変数 次の項目を含むエクスポートされたコンテンツが含まれた ZIP として、新しい BLOB が作成されます。
-
[ドキュメント] フォルダ: 各ドキュメントの画像ファイルまたは PDF が含まれます。ファイル名はドキュメントの ID になります。
-
[FieldData] フォルダ: ドキュメント ID とフィールド/値のペアを含む各ドキュメント タイプごとに行が維持された CSV が含まれます。
-
[Content_types.xml] ファイル: ZIP で使用可能なファイル タイプのリストが含まれます。
- 文字列またはNull 許容文字列: .txt 拡張子を持つ新しい BLOB が作成され、テキスト形式のデータが含まれます。
- データ オブジェクト.json 拡張子を持つ新しい BLOB が作成され、JSON 形式のデータが含まれます。
- [XML]: .xml 拡張子を持つ新しい BLOB が作成され、XML 形式のデータが含まれます。
ZIP は、構成されたコンテナに BLOB としてエクスポートされます。
ファイルは、構成されたコンテナに BLOB としてエクスポートされます。
BLOB 名は変数に基づいた名前となり、デフォルトでは Job_jobid.zip になります。
BLOB 名は変数に基づいた名前となり、デフォルトでは Job_jobid.txt (文字列/Null 許容文字列)、Job_jobid.json (データ オブジェクト)、または Job_jobid.xml (XML) になります。
-
-
同じ名前の BLOB がすでに存在している場合は、設計時の設定に応じて、ファイルが上書きされるか、名前が変更されるか、ジョブが一時停止されます。
-
指定されたインデックス タグとメタデータは、作成されるすべての BLOB に適用されます。
-
新しく作成された BLOB の URL が、BLOB が追加されたコンテナへの一意のパスとして返されます。
-
フォルダ内のドキュメントごとにコンテナ内に BLOB が作成されます。フィールド データの BLOB は、JSON または CSV 形式で作成されます。
-
それぞれのドキュメントの BLOB 名は、指定されたファイル名またはドキュメント ID になります。フィールド データの BLOB 名は同じですが、異なる拡張子を持ちます。
-