クラウド AI
クラウド AI ステップを使用すると、アマゾン ウェブ サービス、Microsoft Azure、および Google Cloud という 3 つのクラウド サービス プロバイダの AI 機能に簡単にアクセスできます。この機能は 3 つのプロバイダ間でわずかに異なりますが、各プロバイダで次のことを実行できます。
-
テキストを別の言語に翻訳する
-
画像を分析し、その中のオブジェクトを特定する
ステップの機能は、選択したクラウド サービス プロバイダによって異なります。クラウド サービスの機能が Amazon、Microsoft、または Google によって変更された場合、クラウド AI ステップは機能を停止することがあります。
ステップは、ステップを実行する API キーに依存します。これらのキーは Kofax RPA の一部ではなく、クラウド プロバイダから取得する必要があります。
画像の分析
3 つのプロバイダはどれも画像の分析が可能で、結果とともに JSON 形式の文字列を返します。
サポートされている画像フォーマットと要件については、各プロバイダのドキュメントを参照してください。
- アマゾン ウェブ サービス
-
Amazon には、「アクセス キー ID」という名前の 2 つの API キーと、対応する「シークレット アクセス キー」が必要です。この API キー ペアには、Amazon Translate サービスへのアクセス権を付与する必要があります。詳細については、Amazon AWS のドキュメントを参照してください。
Amazon サービスを使用する前に、リージョンを指定してください。リージョンはサービスに対して、リクエストを (地理的に) 処理する場所を指示します。ロボットが実行されている場所に近いリージョンを選択することをお勧めします。サポートされているリージョンのリストは、各サービスのドキュメントに記載されています。Amazon はこのリストを必要に応じて変更することができます。
Amazon サービスには、3 つの異なる画像分析方法があります。
-
ラベルの検出: さまざまな種類のオブジェクトを検出します。
-
保護ギアの検出: ヘルメットなどの保護ギアを検出します。
-
顔の検出: 顔とその特徴を検出します。
詳細については、アマゾン ウェブ サービスのドキュメントを参照してください。
-
- Microsoft Azure
-
Azure を画像分析に使用するには、エンドポイントと API キーが必要です。API タイプが「Computer Vision」の「Cognitive Services」サービスを作成して、エンドポイントと API キーを取得します。
API キーは、画像の分析とテキストの翻訳で異なります。
Azure は、要求元に最も近いリージョンにリクエストを自動的に転送します。
画像分析を設定して、計算済みの特定の詳細を返すようにすることができます。これらの設定は、ステップのオプションでオンとオフを切り替えることができます。
詳細については、Microsoft Azure のドキュメントを参照してください。
- Google Cloud
-
Google Cloud を画像分析に使用するには、「Cloud Vision API」へのアクセスを有効にして、API キーを作成します。Google は、要求元に最も近いデータセンターにリクエストを自動的にルーティングします。
画像分析を設定して、計算済みの特定の詳細を返すようにすることができます。これらの設定は、ステップのオプションでオンとオフを切り替えることができます。
詳細については、Google Cloud のドキュメントを参照してください。
テキストの分析
3 つのサービス プロバイダには、ある言語から別の言語にテキストを翻訳するオプションが用意されています。また、Azure にはテキストを文字変換するオプションがあります。
- アマゾン ウェブ サービス
-
Amazon には、「アクセス キー ID」という名前の 2 つの API キーと、対応する「シークレット アクセス キー」が必要です。この API キー ペアには、Amazon Translate サービスへのアクセス権を付与する必要があります。詳細については、Amazon AWS のドキュメントを参照してください。
クラウド AI ステップを作成する場合は、入力の言語コードを指定します。
次の場所にある、サポートされている言語のリストを参照してください。
https://docs.aws.amazon.com/translate/latest/dg/what-is.html#what-is-languages
- Microsoft Azure
-
Azure をテキスト分析に使用するには、場所と API キーが必要です。API タイプが「Translator」の「Cognitive Services」サービスを作成して、場所と API キーを取得します。
API キーは、画像の分析とテキストの翻訳で異なります。
Azure プロバイダは、テキストの翻訳と文字変換を実行できます。クラウド AI ステップを作成する場合は、入力の言語を選択します。サポートされている言語と文字変換は、設計時に Azure からダウンロードされます。
詳細については、Microsoft Azure のドキュメントを参照してください。
- Google Cloud
-
Google Cloud をテキスト分析に使用するには、「Cloud Translation API」へのアクセスを有効にして、API キーを作成します。
クラウド AI ステップを作成する場合は、[ターゲット言語] フィールドで入力テキストの言語コードを指定します。
次の場所にある、現在サポートされている言語のリストを参照してください。
ステップ プロパティ
次のセクションでは、[クラウド AI] ステップ プロパティについて説明します。
オプションの数と名前は、クラウド サービス プロバイダによって異なります。
- データ タイプ
-
-
[画像]: 画像を処理するには、このオプションを選択します。
-
[テキスト]: テキストを分析するには、このオプションを選択します。
-
- ソース
-
-
[画像]: [ローカル ファイル]、[バイナリ データ] (変数)、[RFS]、および [URL] から選択します。ソースのタイプを選択した後に、ファイルのパスまたは URL を指定するか、変数を選択します。
-
[テキスト]: テキスト フィールドにテキストを入力するか、テキストを貼り付けます。あるいは、テキスト変数を指定します。
-
- プロバイダ
-
クラウド サービス プロバイダを選択します。
プロバイダを選択した後に、サービスに接続する場合に必要となるキーおよび他の設定を指定します。上記の各サービスの説明を参照してください。
- アクション
- アクションを選択し、選択したアクションに対して 1 つ以上のオプションを指定します。
- 言語
-
-
[画像]: サービス プロバイダがサポートする言語の中から 1 つを選択します。出力 JSON ファイルには、選択した言語のセクションが含まれています。
-
[テキスト]: 分析するテキストの言語を選択します。文字変換の場合は、[ソース言語] と [ターゲット スクリプト] を指定します。
-
- 結果
- 結果を保存するテキスト形式の変数を指定します。画像の場合、出力テキストには、JSON ドキュメントの作成に使用できる JSON マークアップが含まれています。