イメージのみの PDF ファイルにテキストが含まれる場合、またはテキストを含むイメージ ファイルから PDF ファイルを作成する場合、これらのドキュメントで内容に基づく検索を実行することはできません。これらのファイルを検索できるようにするには、OCR を使用してテキストを抽出する必要があります。検索可能な PDF ドキュメントはページ イメージを提供しますが、個別のレイヤーに認識されたテキストも含まれており、各テキスト文字が、対応するイメージを表します。これにより、PDF を検索できます。検索可能 PDF は、元の外観を正確に維持してアーカイブする必要があるドキュメントの内容にアクセスする場合に特に便利です。
注
[検索可能な PDF] が選択されている場合、入力ファイルでアクセス可能なテキスト レイヤーが検出されなかった場合に限り OCR プロセスが実行されます。テキスト レイヤーが検出された場合、OCR の実行は不要で、このテキスト レイヤーを使用して検索可能な通常の PDF が作成されます。[検索可能な PDF] が無効の場合でも、これは実行されます。
イメージのみの PDF ファイル、または各種イメージ ファイルを検索可能な PDF ドキュメントに変換するには、Create Assistant を使用します。
[検索可能 PDF の変換設定] ダイアログ ボックスで OCR 言語を設定できます。
ヒント
サポートされているファイル タイプのリストについては、「Create Assistant」を参照してください。
Create Assistant は、「検索可能な PDF」という名前の個別のプロファイルを用意していますが、[検索可能な PDF] チェック ボックスをオンにすることで、他のプロファイルを使用して検索可能な PDF を作成することもできます。
Create Assistant で「検索可能な PDF」プロファイルを使用するには
Create Assistant の [プロファイル] 選択ボックスで、[検索可能な PDF] を選択します。
検索可能な PDF に変換する 1 つ以上のファイルを開きます。
[プロファイル] ボタンをクリックし、[PDF Create のプロファイル] ダイアログ ボックスで設定を確認します。[検索可能な PDF] チェック ボックスは、自動的にオンになります。この設定を保持し、必要に応じて他の設定 (セキュリティ、透かしなど) を変更します。
[設定] ボタンをクリックして [検索可能 PDF の変換設定] ダイアログ ボックスを表示します。ソース ドキュメントの言語を選択し、ダイアログ ボックスを閉じます。[OK] をクリックし、[PDF Create のプロファイル] ダイアログ ボックスを閉じます。
[PDF の作成を開始します] ツールをクリックします。[入力文書ごとに PDF を作成] オプションで複数のファイルを選択し、保存オプションで [ファイル名をクエリ] を設定した場合、各 PDF ファイルが生成されるたびに [名前を付けて保存] ダイアログ ボックスが個別に表示されます。
他のプロファイルを使用して検索可能 PDF を作成するには
Create Assistant の [プロファイル] 選択ボックスで、プロファイルを選択してファイルをロードします。
[プロファイル] ボタンをクリックします。
[PDF Create のプロファイル] ダイアログ ボックスで、[検索可能] チェック ボックスをオンにします。
[設定] ボタンをクリックして [検索可能 PDF の変換設定] ダイアログ ボックスを表示します。ソース ドキュメントの言語を選択して、[OK] をクリックします。
[PDF Create のプロファイル] ダイアログ ボックスで、他の設定 (セキュリティ、透かしなど) を確認し、必要に応じて変更します。[OK] をクリックし、上記の説明に従って作成を開始します。
ヒント
MRC 圧縮された検索可能 PDF を生成するには、両方のチェック ボックスをオンにします。この場合、[設定] ボタンをクリックすると、[検索可能 MRC PDF の変換設定] ダイアログ ボックスが表示されます。
イメージのみの PDF ファイルまたはイメージのみのページが含まれる PDF ファイルを Power PDF で開くときに、プログラムでファイルの内容を自動検出できます ([ファイル] > [オプション] > [ドキュメント] > [検索可能な PDF ドキュメント])。これを行うには、関連するチェック ボックスをオフにします (既定ではオンになっています)。確認メッセージを受け入れると、ドキュメントを次の形式にすることができます。
検索可能 PDF: ページの元のイメージをそのまま残して外観を維持しつつ、検索可能なテキスト レイヤーを追加します。
標準 PDF: テキストが生成され、画像は保持されますが、元のページ イメージは破棄されます。
PDF フォーム: ファイルに対して Form Typer を実行し、アクティブなフォーム コントロールを作成します。
PDF ファイルはそのまま残ります。
詳細については、「PDF ドキュメントの編集について」を参照してください。
注
Power PDF では、画像のみの PDF や画像のみの部分がある PDF を、[ホーム] > [変換] の [検索可能な PDF の作成] コマンドを使用して検索可能な PDF に変換できます。この変換は [ファイル] > [オプション] > [ドキュメント] > [検索可能な PDF ドキュメント] で調整できます。画像のみの部分があるページでのみ OCR を実行するか、またはすべてのページで OCR を実行するかを選択できます。この場合、PDF のすべてのテキスト レイヤー コンテンツが OCR 結果によって置換されます。もう 1 つのオプションでは、テキスト レイヤーが存在しても非標準のエンコーディングに起因して利用できない場合に OCR が実行されます。生成されたテキストを校正して、OCR 処理の精度を上げることができます。