Document Transformation
Document Transformation ステップでは、画像およびテキスト ドキュメントから情報を抽出して使用することができます。Document Transformation Service は、.png、.jpeg、.jpg、.tif、tiff、.pdf、および .txt ファイルを処理できます。複数のドキュメントは、.zip アーカイブまたはファイルを含むフォルダへのパスのいずれかの形で送信することができます。Transformation でドキュメント分離機能を使用すると、Tungsten RPA は、Document Transformation ブラウザで移動できる複数のドキュメントを受信します。
Design Studio で、Document Transformation ステップを使用するロボットを実行するには、ロボットを共有プロジェクトに配置します。
Document Transformation Service は、Sentiment プロジェクトを使用して自然言語処理 (NLP) リクエストを処理することもできます。これにより、ユーザーはテキストのムード (ポジティブまたはネガティブなど) を検出し、会社名、個人名などのエンティティを抽出することができます。Sentiment プロジェクトを使用して顧客レビューを処理し、顧客がサービスに満足しているかどうかを理解できます。また、記事内の会社に関するすべての言及を検索するためにも使用できます。Sentiment プロジェクトは、Transformation Toolkit バージョン 7.0.0 以降で使用できます。詳細については、事前定義済みのプロジェクトの Sentiment プロジェクトを参照してください。
Document Transformation ワークフロー
Document Transformation アクションでは、選択したプロジェクトを使用してグラフィカル ドキュメントまたは PDF ドキュメントを処理します。プロジェクトは、OCR やその他の指定された操作を実行してドキュメントを処理および変換するモジュールです。
処理結果はロボットに戻され、レコーダー ビューの Document Transformation Browser で開きます。サービスは、抽出されたすべての情報を含む要素ツリーを形成します。複数ページのドキュメントでは、Document Transformation ブラウザのツールバーの [前へ] および [次へ] ボタンを使用してページを移動できます。詳細については、「DT ブラウザとアクション ステップ」を参照してください。
ツリーの要素には、プロジェクトで定義された OCR 結果やその他の抽出結果の信頼度が含まれています。confidence 属性には、0 から 1 までの値を含めることができます。一番高い信頼度は 1 です。

der_x などの拡張属性を使用して要素を見つけることができます。これはファインダーで使用できます。
変換されたドキュメントをエディターで開いた後に、変換結果の検証を実行するかどうかを決定できます。検証なしで変換結果に満足できた場合は、ドキュメントのデータを抽出して使用することができます。
検証は Document Transformation Thin Client によって実行されます。指定された Thin Client にドキュメントを送信するには、Document Transformation Browser の [
] をクリックします。一意の URL が生成され、ロボットに返されます。ロボットは URL を抽出し、それを使用して電子メールなどを介して検証ユーザーにドキュメントを送信します。検証ユーザーは URL をクリックし、資格情報を入力します。その後、抽出されたデータを含むドキュメントが開きます。検証ユーザーは、変換されたドキュメントを調べ、必要であれば、ドキュメント内の抽出された情報を修正します。
ドキュメントの検証時に、ユーザーはオンライン ラーニングを有効にして、同じようなドキュメントでのフィールド認識の確率を上げることができます。この機能は、請求書などのサンプル ドキュメントのレイアウトの記憶に基づいています。自動フィールド入力を使用、ドキュメントに正しい値を手動で入力または選択することにより、ユーザーはナレッジ ベースに貢献します。これによってユーザーが次回同様のドキュメントを表示する際に、抽出結果が改善されます。
検証が終了すると、検証ユーザーはそのドキュメントを有効であるとマークします。有効であるとマークされたドキュメントは、Document Transformation アクションの [コールバック] オプションで指定されたロボットの引数として使用されます。
Document Transformation を開くステップのメタ データを含めるには、[ステップを移行] を実行した後にロボットを閉じて開きます。
ステップ プロパティ
- アクション
-
Document Transformation Service を使用して、実行するアクションを選択します。
- サービス URL
-
必要に応じて、Document Transformation Service を実行しているコンピュータの URL とポートを指定します。サービスがローカルにインストールされている場合は、このフィールドに localhost と入力します。URL には、http:// または https:// プレフィックスが含まれている必要があります。https を使用する場合、Web ホスティング サービスにはよく知られている認証機関によって受け入れられた証明書が必要です。
- プロジェクトのタイプ
-
-
デフォルトのプロジェクト: このオプションは、事前定義済みのプロジェクトのセットを提供します。事前定義済みのプロジェクトを参照してください。
-
カスタム プロジェクト: このオプションを選択する場合、[カスタム プロジェクトのパス] でドキュメントを処理するプロジェクトへのパスを指定します。
[カスタム プロジェクトのパス] は、Document Transformation Service サーバーを参照します。絶対パス、またはDocument Transformation\Projects フォルダからの相対パスのいずれかにすることができます。
-
- ドキュメント ソース
-
ロボットが処理するドキュメントを検索する方法を選択します。
-
ローカル ファイル: [ファイル名] で処理するドキュメントのパスを入力します。ロボットを実行しているコンピュータからアクセス可能なイメージ ファイル、.zip アーカイブ、ファイルを含むフォルダ、またはその他のサポートされている形式のファイルのいずれかのフル パスを指定します。
-
ロボット ファイル システム: 構成済みのファイル システムへのパスとファイル名 (Myshare/doctotransform.pdf など) を入力します。ファイル システム名は、Management Console 内の[ロボット ファイル システム] セクションでの指定に対応している必要があります。
-
バイナリ変数: ドキュメントを含むバイナリ変数を指定します。
-
- メタデータ
-
追加のデータを Document Transformation Service に渡すには、このオプションを選択します。
このデータは XValues として入力ドキュメントに追加されるため、Document Transformation Service プロジェクトで使用することができます。プロジェクトは通常、このデータを使用して分析を調整または制御します。このオプションの一般的な使用例としては、言語設定または顧客 ID などが挙げられます。XValues は、処理されたドキュメントが Document Transformation Service から返された後に、デバイス ツリーで使用することができます。
特定のプロジェクトでサポートされている値を確認する場合は、Document Transformation Service プロジェクトの開発者に問い合わせてください。
複数のキーと値のペアを [メタデータ] プロパティに追加できます。
いずれかの [キー] がリストに複数回表示されている場合は、最後の [値] が使用されます。
- 検証 URL
-
シン クライアント サービスの URL を指定するには、このオプションを選択します。このプロパティは、処理されたドキュメントを検証の目的で送信するために必要です。URL は、Document Transformation Service の ValidationService プロパティで指定します。URL は次のようになります。
http://localhost:50082
- コールバック
-
ドキュメントの検証後にシン クライアント サービスで呼び出す必要があるロボットを指定するには、このオプションを選択します。検証が完了すると、ロボットは実行のために Management Console のキューに登録されます。
-
[ロボット プロジェクト]: 呼び出すロボットが存在するプロジェクト(デフォルトのプロジェクトなど) を指定します。
-
[ロボット名とパス]: ロボットがプロジェクトのフォルダ内にある場合は、そのロボットの名前とパス(MyRobot.robot、folder/subfolder/MyRobot.robot など) を指定します。
検証が完了すると、[コールバック] オプションで指定されたロボットに返されるドキュメントには、ドキュメントのバッチを検証したユーザーの名前が含まれます。この情報は、KDTS-ValidatingUser という名前の XValue として提供されます。
コールバック ロボットをキューに格納する Management Console を見つけるために、Document Transformation ステップが設定されたロボットは、ステップが実行される RoboServer 用に設定された Management Console URL を使用します。ロボットを Design Studio で実行した場合は、プロジェクトが属する Management Console の URL が使用されます。
これらの設定済み URL では、Management Console を実行しているコンピュータのホスト名または IP アドレスを使用する必要があります。Document Transformation サービスが Management Console にアクセスできず、コールバック ロボットがキューに格納されなくなるため、localhost は使用しないようにしてください。
-