検索可能 PDF の変換設定

このダイアログ ボックスは、次のいずれかの操作を行った場合に表示されます。

  • [検索可能] チェック ボックスがオンの状態で、[PDF Create のプロファイル] ダイアログ ボックスで [設定] ボタンをクリックした場合。
  • [変換] > [その他] > [検索可能 PDF] をクリックしてから、[ページの変換] ダイアログ ボックスで [設定] をクリックした場合。
  • [ファイル] > [オプション] > [ドキュメント] > [検索可能な PDF ドキュメント] で OCR 処理の設定を指定した場合。

イメージ ファイルまたは検索不可能なイメージのみの PDF ファイルから検索可能 PDF を作成するには、これらの設定を使用します。サポートされているファイル タイプのリストについては、「Create Assistant」を参照してください。

OCR の言語
イメージからテキストを抽出してイメージ ファイルを検索可能にするには、OCR が必要です。ソース ドキュメントで使用されている言語を選択します。
無視する文字
認識できない文字は、無視する文字 (デフォルトでは、チルダ: ~) で表されます。たとえば、OCR が REJECT の J を認識できず、~ が無視する文字の場合、ドキュメントには文字列 RE~ECT として表示されます。
[無視する文字] 編集ボックスに、使用する文字を入力します。ドキュメントで使用されることのない文字を選択するようにしてください。
元のイメージを保持
変換後に元のイメージを保持する場合は、このチェック ボックスをオンにします。
ページの向きを自動設定
このチェック ボックスをオンにすると、ページの向きを設定します (横向きまたは縦向き)。
処理するページ
PDF ドキュメントを検索可能な形式に変換す場合時に処理するページを選択します。
  • イメージのみのページ:デフォルトでは、Power PDF は、テキスト レイヤーを含まない、イメージ (ビットマップ) コンテンツのみを含むページのみを処理します。
  • すべてのページ:コンポーネントに関係なくページを処理する場合に、このオプションを選択します。
    • OCR を使用して文書を処理:OCR のみでドキュメントを処理する場合に、このオプションを選択します。内部的にはすべてのページがビットマップ形式に変換され、OCR によって処理されます。これにより、すべての非表示の要素および非標準の要素 (非表示のオブジェクトやカバーされたオブジェクト、非標準文字コードのフォントを使用したテキストなど) が削除されるため、検索可能 PDF に変換するための標準的な手順が失敗するような場合に役立ちます。
    • 標準エンコード以外のページを認識:このオプションを選択して、独自のフォントや特殊な文字エンコードを含むページを処理します。
OCR 後の結果を自動的に校正
(Power PDF でのみアクセス可能) 処理したドキュメントで対話型のスペル チェックを実行するには、このオプションを選択します。独自の語彙を追加または作成するには、[ユーザー辞書] をクリックします。
イメージのみのページを自動で検出 (再起動が必要)
(Power PDF でのみアクセス可能) このオプションを選択すると、PDF を開いたときに Power PDF でチェックが実行され、ドキュメントにイメージのみのページがある場合は検索可能 PDF に変換されます。確認に時間がかかる可能性があるため、このオプションはデフォルトではオフに設定されています。
情報バーで通知する
(Power PDF でのみアクセス可能。上記のチェック ボックスが選択されている場合にのみ有効になります。)Power PDF でリボンの下の通知バーにイメージのみのページを通知するように指定するには、「情報バーで通知する」を選択します。[自動検出] ダイアログ ボックスを表示するには [検索可能にする] をクリックし、イメージのみのページに適用するには OCR オプションから選択します。
イメージのみのページが見つかった場合に、Power PDF が通知を行わずに [自動検出] ダイアログ ボックスを表示するように指定には、「情報バーで通知する」をクリアします。

入力ファイルがテキスト ファイルである場合、または入力ファイルにアクセス可能なテキスト レイヤーがある場合、OCR は実行されずに通常の検索可能 PDF が作成されます。したがって、このような場合には、OCR の言語および無視する文字の設定は使用されません。