PDF ファイルを検索可能にする

イメージのみの PDF ファイルにテキストが含まれる場合、またはテキストを含むイメージファイルから PDF ファイルを作成する場合、これらのドキュメントで内容に基づく検索を実行することはできません。これらのファイルを検索可能にするには、OCR を使用してテキストを抽出する必要があります。検索可能な PDF ドキュメントはページイメージを提供しますが、個別のレイヤーに認識されたテキストも含まれており、各テキスト文字が、対応するイメージを表します。これにより、PDF を検索できます。検索可能 PDF は、元の外観を正確に維持してアーカイブする必要があるドキュメントの内容にアクセスする場合に特に便利です。

[検索可能 PDF] が選択されている場合、入力ファイルでアクセス可能なテキストレイヤーが検出されなかった場合に限り OCR プロセスが実行されます。テキストレイヤーが検出された場合、OCR の実行は不要で、このテキストレイヤーを使用して検索可能な通常の PDF が作成されます。[検索可能 PDF] が無効の場合でも、これは実行されます。

イメージのみの PDF ファイル、または各種イメージファイルを検索可能な PDF ドキュメントに変換するには、Create Assistant を使用します。

サポートされているファイルタイプのリストについては、「Create Assistant」を参照してください。

[検索可能 PDF の変換設定] ダイアログボックスで OCR 言語を設定できます。

Create Assistant には、「検索可能な PDF」という名前の個別のプロファイルが用意されていますが、[検索可能 PDF] チェックボックスをオンにすると、検索可能な PDF を他のプロファイルを使用して作成することもできます。

Create Assistant での「検索可能 PDF」プロファイルの使用

Create Assistant の [プロファイル] リストで、[検索可能 PDF] を選択します。
検索可能な PDF に変換する 1 つ以上のファイルを開きます。
[プロファイル] ボタンをクリックし、[PDF Create のプロファイル] ダイアログボックスで設定を確認します。[検索可能 PDF] チェックボックスはデフォルトでオンになっています。この設定を保持し、必要に応じて他の設定 (セキュリティ、または透かしなど) を変更します。
[検索可能 PDF の変換設定] ダイアログボックスを表示するには、[設定] ボタンをクリックします。
1. [OCR の言語] リストでソースドキュメントの言語を選択します。
2. 必要に応じて他の設定を変更し、[OK] をクリックしてダイアログボックスを閉じます。
[OK] をクリックして [PDF Create のプロファイル] ダイアログボックスを閉じます。
[PDF の作成を開始] ツールをクリックします。

保存処理は、現在の出力先の設定に基づいて行われます。生成された PDF ファイルは、ソースフォルダまたは定義済みのフォルダに保存されます。または [名前を付けて保存] ダイアログボックスが表示されます。

情報ダイアログボックスには、作成プロセスに関するステータス情報と、生成された PDF ファイルのリストがファイル名、パス、ファイルタイプ、および作成日とともに表示されます。
[印刷情報] ダイアログボックスに、作成プロセスに関するステータス情報と、生成された PDF ファイルのリストがファイル名、パス、ファイルタイプ、および作成日とともに表示されます。[閉じる] をクリックして [PDF の作成] ウィンドウに戻り、ウィンドウを閉じます。[PDF の作成] ウィンドウに戻り、ウィンドウを閉じるには、[閉じる] をクリックします。

他のプロファイルを使用した、Create Assistant での検索可能 PDF の作成

Create Assistant の [プロファイル] リストで、プロファイルを選択してファイルをロードします。
[プロファイル] をクリックします。
[PDF Create のプロファイル] ダイアログボックスで、[検索可能] チェックボックスをオンにします。

MRC 圧縮された検索可能 PDF を生成するには、両方のチェックボックスをオンにします。この場合、[設定] ボタンをクリックすると、[検索可能 MRC PDF の変換設定] ダイアログボックスが表示されます。
[検索可能 PDF の変換設定] ダイアログボックスを表示するには、[設定] ボタンをクリックします。ソースドキュメントの言語を選択して、[OK] をクリックします。
[PDF Create のプロファイル] ダイアログボックスで、他の設定 (セキュリティ、または透かしなど) を確認し、必要に応じて変更します。
[OK] をクリックして [PDF Create のプロファイル] ダイアログボックスを閉じます。
[PDF の作成を開始] ツールをクリックします。

保存処理は、現在の出力先の設定に基づいて行われます。生成された PDF ファイルは、ソースフォルダまたは定義済みのフォルダに保存されます。または [名前を付けて保存] ダイアログボックスが表示されます。
情報ダイアログボックスには、作成プロセスに関するステータス情報と、生成された PDF ファイルのリストがファイル名、パス、ファイルタイプ、および作成日とともに表示されます。[PDF の作成] ウィンドウに戻り、ウィンドウを閉じるには、[閉じる] をクリックします。

イメージのみの部分を含む PDF を Power PDF で検索可能にする

Power PDF でイメージのみの PDF またはイメージのみの部分を含む PDF を検索可能な PDF に変換するには、次の手順を実行します。

この変換は、[ファイル] > [オプション] > [ドキュメント] > [検索可能な PDF ドキュメント] で実行することができます。

リボンの [ホーム] タブで [検索可能な PDF の作成] をクリックします。
[ページの変換] ダイアログボックスで、OCR (光学文字認識) をイメージのみの部分があるページのみで実行するか、すべてのページで実行するかを選択します。この場合、PDF のすべてのテキストレイヤーコンテンツが OCR 結果によって置換されます。
[検索可能 PDF の変換設定] ダイアログボックスを表示するには、[設定] をクリックします。必要に応じて最も重要な設定を更新し、[OK] をクリックして変更を保存し、戻ります。

設定の詳細については、「PDF ドキュメントの編集について」を参照してください。
1. [OCR の言語] リストでソースドキュメントの言語を選択します。
2. テキストレイヤーが存在していても非標準エンコードであるため使用できない場合にOCR を実行するには、[OCR を使用して文書を処理] を選択します。
3. 生成されたテキストを校正して OCR プロセスの精度を高めるには、[OCR 後の結果を自動的に校正] を選択します。
変換を実行するには、[OK] をクリックします。