検索可能な PDF

イメージのみの PDF ファイルにテキストが含まれる場合、またはテキストを含むイメージファイルから PDF ファイルを作成する場合、これらのドキュメントで内容に基づく検索を実行することはできません。これらのファイルを検索できるようにするには、OCR を使用してテキストを抽出する必要があります。検索可能な PDF ドキュメントはページイメージを提供しますが、個別のレイヤーに認識されたテキストも含まれており、各テキスト文字が、対応するイメージを表します。これにより、PDF を検索できます。検索可能 PDF は、元の外観を正確に維持してアーカイブする必要があるドキュメントの内容にアクセスする場合に特に便利です。

注

[検索可能な PDF] が選択されている場合、入力ファイルでアクセス可能なテキストレイヤーが検出されなかった場合に限り OCR プロセスが実行されます。テキストレイヤーが検出された場合、OCR の実行は不要で、このテキストレイヤーを使用して検索可能な通常の PDF が作成されます。[検索可能な PDF] が無効の場合でも、これは実行されます。

イメージのみの PDF ファイル、または各種イメージファイルを検索可能な PDF ドキュメントに変換するには、Create Assistant を使用します。

[検索可能 PDF の変換設定] ダイアログボックスで OCR 言語を設定できます。

ヒント

サポートされているファイルタイプのリストについては、「Create Assistant」を参照してください。

Create Assistant は、「検索可能な PDF」という名前の個別のプロファイルを用意していますが、[検索可能な PDF] チェックボックスをオンにすることで、他のプロファイルを使用して検索可能な PDF を作成することもできます。

Create Assistant で「検索可能な PDF」プロファイルを使用するには

Create Assistant の [プロファイル] 選択ボックスで、[検索可能な PDF] を選択します。
検索可能な PDF に変換する 1 つ以上のファイルを開きます。
[プロファイル] ボタンをクリックし、[PDF Create のプロファイル] ダイアログボックスで設定を確認します。[検索可能な PDF] チェックボックスは、自動的にオンになります。この設定を保持し、必要に応じて他の設定 (セキュリティ、透かしなど) を変更します。
[設定] ボタンをクリックして [検索可能 PDF の変換設定] ダイアログボックスを表示します。ソースドキュメントの言語を選択し、ダイアログボックスを閉じます。[OK] をクリックし、[PDF Create のプロファイル] ダイアログボックスを閉じます。
[PDF の作成を開始します] ツールをクリックします。[入力文書ごとに PDF を作成] オプションで複数のファイルを選択し、保存オプションで [ファイル名をクエリ] を設定した場合、各 PDF ファイルが生成されるたびに [名前を付けて保存] ダイアログボックスが個別に表示されます。

他のプロファイルを使用して検索可能 PDF を作成するには

Create Assistant の [プロファイル] 選択ボックスで、プロファイルを選択してファイルをロードします。
[プロファイル] ボタンをクリックします。
[PDF Create のプロファイル] ダイアログボックスで、[検索可能] チェックボックスをオンにします。
[設定] ボタンをクリックして [検索可能 PDF の変換設定] ダイアログボックスを表示します。ソースドキュメントの言語を選択して、[OK] をクリックします。
[PDF Create のプロファイル] ダイアログボックスで、他の設定 (セキュリティ、透かしなど) を確認し、必要に応じて変更します。[OK] をクリックし、上記の説明に従って作成を開始します。

ヒント

MRC 圧縮された検索可能 PDF を生成するには、両方のチェックボックスをオンにします。この場合、[設定] ボタンをクリックすると、[検索可能 MRC PDF の変換設定] ダイアログボックスが表示されます。

イメージのみの PDF ファイルまたはイメージのみのページが含まれる PDF ファイルを Power PDF で開くときに、プログラムでファイルの内容を自動検出できます ([ファイル] > [オプション] > [ドキュメント] > [検索可能な PDF ドキュメント])。これを行うには、関連するチェックボックスをオフにします (既定ではオンになっています)。確認メッセージを受け入れると、ドキュメントを次の形式にすることができます。

検索可能 PDF: ページの元のイメージをそのまま残して外観を維持しつつ、検索可能なテキストレイヤーを追加します。
標準 PDF: テキストが生成され、画像は保持されますが、元のページイメージは破棄されます。
PDF フォーム: ファイルに対して Form Typer を実行し、アクティブなフォームコントロールを作成します。
PDF ファイルはそのまま残ります。

詳細については、「PDF ドキュメントの編集について」を参照してください。

注

Power PDF では、画像のみの PDF や画像のみの部分がある PDF を、[ホーム] > [変換] の [検索可能な PDF の作成] コマンドを使用して検索可能な PDF に変換できます。この変換は [ファイル] > [オプション] > [ドキュメント] > [検索可能な PDF ドキュメント] で調整できます。画像のみの部分があるページでのみ OCR を実行するか、またはすべてのページで OCR を実行するかを選択できます。この場合、PDF のすべてのテキストレイヤーコンテンツが OCR 結果によって置換されます。もう 1 つのオプションでは、テキストレイヤーが存在しても非標準のエンコーディングに起因して利用できない場合に OCR が実行されます。生成されたテキストを校正して、OCR 処理の精度を上げることができます。