PDF ファイルを検索可能にする

イメージのみの PDF ファイルにテキストが含まれる場合、またはテキストを含むイメージ ファイルから PDF ファイルを作成する場合、これらのドキュメントで内容に基づく検索を実行することはできません。これらのファイルを検索可能にするには、OCR を使用してテキストを抽出する必要があります。検索可能な PDF ドキュメントはページ イメージを提供しますが、個別のレイヤーに認識されたテキストも含まれており、各テキスト文字が、対応するイメージを表します。これにより、PDF を検索できます。検索可能 PDF は、元の外観を正確に維持してアーカイブする必要があるドキュメントの内容にアクセスする場合に特に便利です。

[検索可能 PDF] が選択されている場合、入力ファイルでアクセス可能なテキスト レイヤーが検出されなかった場合に限り OCR プロセスが実行されます。テキスト レイヤーが検出された場合、OCR の実行は不要で、このテキスト レイヤーを使用して検索可能な通常の PDF が作成されます。[検索可能 PDF] が無効の場合でも、これは実行されます。

イメージのみの PDF ファイル、または各種イメージ ファイルを検索可能な PDF ドキュメントに変換するには、Create Assistant を使用します。

サポートされているファイル タイプのリストについては、「Create Assistant」を参照してください。

[検索可能 PDF の変換設定] ダイアログ ボックスで OCR 言語を設定できます。

Create Assistant には、「検索可能な PDF」という名前の個別のプロファイルが用意されていますが、[検索可能 PDF] チェック ボックスをオンにすると、検索可能な PDF を他のプロファイルを使用して作成することもできます。

Create Assistant での「検索可能 PDF」プロファイルの使用

  1. Create Assistant の [プロファイル] リストで、[検索可能 PDF] を選択します。
  2. 検索可能な PDF に変換する 1 つ以上のファイルを開きます。
  3. [プロファイル] ボタンをクリックし、[PDF Create のプロファイル] ダイアログ ボックスで設定を確認します。[検索可能 PDF] チェック ボックスはデフォルトでオンになっています。この設定を保持し、必要に応じて他の設定 (セキュリティ、または透かしなど) を変更します。
  4. [検索可能 PDF の変換設定] ダイアログ ボックスを表示するには、[設定] ボタンをクリックします。
    1. [OCR の言語] リストでソース ドキュメントの言語を選択します。
    2. 必要に応じて他の設定を変更し、[OK] をクリックしてダイアログ ボックスを閉じます。
  5. [OK] をクリックして [PDF Create のプロファイル] ダイアログ ボックスを閉じます。
  6. PDF の作成を開始アイコン [PDF の作成を開始] ツールをクリックします。

    保存処理は、現在の出力先の設定に基づいて行われます。生成された PDF ファイルは、ソース フォルダまたは定義済みのフォルダに保存されます。または [名前を付けて保存] ダイアログ ボックスが表示されます。

    情報ダイアログ ボックスには、作成プロセスに関するステータス情報と、生成された PDF ファイルのリストがファイル名、パス、ファイル タイプ、および作成日とともに表示されます。

  7. [印刷情報] ダイアログ ボックスに、作成プロセスに関するステータス情報と、生成された PDF ファイルのリストがファイル名、パス、ファイル タイプ、および作成日とともに表示されます。[閉じる] をクリックして [PDF の作成] ウィンドウに戻り、ウィンドウを閉じます。[PDF の作成] ウィンドウに戻り、ウィンドウを閉じるには、[閉じる] をクリックします。

他のプロファイルを使用した、Create Assistant での検索可能 PDF の作成

  1. Create Assistant の [プロファイル] リストで、プロファイルを選択してファイルをロードします。
  2. [プロファイル] をクリックします。
  3. [PDF Create のプロファイル] ダイアログ ボックスで、[検索可能] チェック ボックスをオンにします。

    MRC 圧縮された検索可能 PDF を生成するには、両方のチェック ボックスをオンにします。この場合、[設定] ボタンをクリックすると、[検索可能 MRC PDF の変換設定] ダイアログ ボックスが表示されます。

  4. [検索可能 PDF の変換設定] ダイアログ ボックスを表示するには、[設定] ボタンをクリックします。ソース ドキュメントの言語を選択して、[OK] をクリックします。
  5. [PDF Create のプロファイル] ダイアログ ボックスで、他の設定 (セキュリティ、または透かしなど) を確認し、必要に応じて変更します。
  6. [OK] をクリックして [PDF Create のプロファイル] ダイアログ ボックスを閉じます。
  7. PDF の作成を開始アイコン [PDF の作成を開始] ツールをクリックします。

    保存処理は、現在の出力先の設定に基づいて行われます。生成された PDF ファイルは、ソース フォルダまたは定義済みのフォルダに保存されます。または [名前を付けて保存] ダイアログ ボックスが表示されます。

  8. 情報ダイアログ ボックスには、作成プロセスに関するステータス情報と、生成された PDF ファイルのリストがファイル名、パス、ファイル タイプ、および作成日とともに表示されます。[PDF の作成] ウィンドウに戻り、ウィンドウを閉じるには、[閉じる] をクリックします。

イメージのみの部分を含む PDF を Power PDF で検索可能にする

Power PDF でイメージのみの PDF またはイメージのみの部分を含む PDF を検索可能な PDF に変換するには、次の手順を実行します。

この変換は、[ファイル] > [オプション] > [ドキュメント] > [検索可能な PDF ドキュメント] で実行することができます。

  1. 検索可能な PDF の作成アイコン リボンの [ホーム] タブで [検索可能な PDF の作成] をクリックします。
  2. [ページの変換] ダイアログ ボックスで、OCR (光学文字認識) をイメージのみの部分があるページのみで実行するか、すべてのページで実行するかを選択します。この場合、PDF のすべてのテキスト レイヤー コンテンツが OCR 結果によって置換されます。
  3. [検索可能 PDF の変換設定] ダイアログ ボックスを表示するには、[設定] をクリックします。必要に応じて最も重要な設定を更新し、[OK] をクリックして変更を保存し、戻ります。

    設定の詳細については、「PDF ドキュメントの編集について」を参照してください。

    1. [OCR の言語] リストでソース ドキュメントの言語を選択します。
    2. テキスト レイヤーが存在していても非標準エンコードであるため使用できない場合にOCR を実行するには、[OCR を使用して文書を処理] を選択します。
    3. 生成されたテキストを校正して OCR プロセスの精度を高めるには、[OCR 後の結果を自動的に校正] を選択します。
  4. 変換を実行するには、[OK] をクリックします。