PDF

PDF のステップは、Tungsten SignDoc 機能を使用して PDF ドキュメントと署名ドキュメントからコンテンツを抽出するために役立ちます。

CentOS/Red Hat Enterprise Linux 7.x オペレーティング システムでは、PDF 抽出機能はサポートされていません。

[レコーダー ビュー] には、PDF ドキュメント ツリーの単一ページと抽出されたテキストが表示されます。ロボットは、[アプリケーション アクション] メニューで利用できる [次のページ]、[前のページ]、および [ページに移動] アクションを使用して、ドキュメント内を移動します。メニューは、[レコーダー ビュー] のアプリケーション タブを右クリックすると表示されます。

テキスト抽出の結果は、PDF データの内部データと構造に依存します。テキストは、PDF ドキュメントの書式設定およびデータの基になるアクセシビリティに基づいて分割され、ページ境界の外側にあるテキストや、重複する要素によって非表示になっているテキストが含まれる場合があります。必要なアクセシビリティ データが (通常は古い) PDF ドキュメントに含まれていない場合は、OCR を使用してテキストを抽出するために画像からテキスト抽出ステップを使用する必要がある場合があります。

[テキストを抽出] アプリケーション アクションおよび [テキストを抽出] コンポーネント アクションを使用して、ページの特定の領域から構造化テキストを抽出することができます。

プロパティ

アクション

[開く] を選択して PDF ファイルをロードします。

ドキュメント ソース
  • ローカル ファイル: [ファイルのパス] フィールドで、ローカル ファイル システム内のファイルのパスを指定します。

  • ロボット ファイル システム: [ファイルのパス] フィールドで、ロボット ファイル システム内のファイルのパスを指定します。

  • バイナリ: バイナリ形式の PDF ドキュメントを含む変数またはエクスプレッションを指定します。

パスワード

必要に応じて、このオプションを選択して、PDF にアクセスするためのパスワードを指定します。

ページ番号

必要に応じて、ドキュメントを開いた後に表示する物理ページを指定します。このプロパティが指定されていない場合は、最初のページが表示されます。

アプリケーション アクション

アクション

説明

ページに移動

指定したページに移動します。

次のページ

次のページに移動します。

前のページ

前のページに移動します。

テキストを抽出

ページ領域からテキストを抽出して、選択した変数に挿入します。

テキストを抽出する場合は、次のオプションを指定します。

  • X: ページの左端からの水平オフセットを設定します。

  • [Y]: ページの上端からの垂直オフセットを設定します。

  • []: 幅を指定します。

  • 高さ: 高さを指定します。

  • 包括: 境界ボックスに、指定した領域を超えた文字が含まれるようにする場合に選択します。

    デフォルトでは、このオプションは選択されていません。つまり、境界ボックスには、指定した領域内に完全に収まる文字のみが含まれます。

すべてのユニットはデバイス ツリーの座標内にあります。

画像を挿入

ローカル フォルダからドキュメント内の選択したページに JPEG または PNG 画像を挿入します。

RFS フォルダはサポートされていません。

画像は、ページの左上隅を基準として、画像の左上隅の X 座標と Y 座標に基づいて配置されます。

サポートされている単位は次のとおりです。

  • デバイス ツリーの座標

  • インチ/センチメートル

  • ページ サイズに対する相対値 (パーセンテージで指定)

以下のルールに注意してください。

  • 負の値は反対側のマージンを指定します。X 値が -1 インチの場合、画像は右マージンから 1 インチの位置に配置されます。

  • いずれかの寸法 (幅または高さ) が 0 の場合、画像は画像の他の寸法とアスペクト比に基づいて配置されます。

  • アスペクト比に基づいて画像のサイズを変更すると、画像は指定した領域の中央に配置されます。

  • これらの計算の後に、X、Y、幅、および高さの最終値がページの寸法または他のページ変換に対して検証されることはありません。このため、画像の一部がページ内に収まらない可能性があります。

画像を挿入する場合は、次のオプションを指定します。

  • [画像のパス]: 画像のフル パスを入力します。

  • [ユニット]: 画像の座標とサイズの単位を指定します。

  • [X]: ページの左端からの水平オフセットを設定します。

  • [Y]: ページの上端からの垂直オフセットを設定します。

  • []: 画像の幅を指定します。

  • [高さ]: 画像の高さを指定します。

  • [縦横比を維持]: 指定した座標内に指定のサイズの画像を挿入するときに、元のアスペクト比を維持します。

画像を挿入 (変数)

変数からドキュメント内の選択したページに画像を挿入します。画像を挿入する場合は、[画像を挿入] アクションと同じオプションを指定しますが、画像パスを指定する代わりに、画像を含んだバイナリ変数の名前を指定します。

名前を付けて保存

ドキュメントのコピーを保存するステップを挿入します。PDF ファイルを保存するフル パスを指定します。

変数に保存

ドキュメントのコピーをバイナリ変数に保存します。

閉じる

閉じる

SignDoc アクション

SignDoc で署名

Tungsten SignDoc セッションを作成し、PDF ドキュメントをすぐに送信します。

SignDoc で署名 (テンプレート)

Tungsten SignDoc テンプレートに基づいて Tungsten SignDoc セッションを作成し、すぐに PDF ドキュメントを送信します。

SignDoc 署名フィールドを挿入

PDF ドキュメントの現在のページに署名フィールドを挿入します。フィールドはページには表示されませんが、アプリケーション ツリーには Tungsten SignDoc フィールドとして表示されます。

SignDoc プロパティを取得

Tungsten SignDoc セッションのプロパティを照会します。

SignDoc リクエストを完了

Tungsten SignDoc セッションを閉じて、Tungsten SignDoc パッケージの処理方法を指定します。

Tungsten SignDoc を使用してドキュメントに証明する方法については、ドキュメントへの署名を参照してください。

コンポーネント アクション

アクション

説明

テキストを抽出

PDF ドキュメントの選択したコンポーネントからテキストを変数に抽出します。

テキストを抽出する場合は、次のオプションを指定します。

  • (オプション): テキストを抽出する領域の幅を設定します。

  • 高さ (オプション): テキストを抽出する領域の高さを設定します。

  • 包括: 境界ボックスに、指定した領域を超えた文字が含まれるようにする場合に選択します。

    デフォルトでは、このオプションは選択されていません。つまり、境界ボックスには、指定した領域内に完全に収まる文字のみが含まれます。

すべてのユニットはデバイス ツリーの座標内にあります。

SignDoc アクション

SignDoc 署名フィールドを挿入

コンポーネント ファインダーに基づいて署名フィールドを挿入します。フィールドはページには表示されませんが、アプリケーション ツリーには Tungsten SignDoc フィールドとして表示されます。

フィールドを更新する

サポート対象であると Tungsten SignDoc で識別されたPDF ドキュメント内のフォーム フィールドの属性を更新します。サポートされているフィールドは、アプリケーション ツリーの Tungsten SignDoc ノードの下にリストされます。

SignDoc 署名者の割り当て

PDF ファイルに既存の署名フィールドに署名者を割り当てます。これらのフィールドはページには表示されませんが、アプリケーション ツリーには Tungsten SignDoc フィールドとして表示されます。