可搜索的 PDF

如果您的文本在只包含图像的 PDF 文件中,或者从包含文本的图像文件生成 PDF 文件,则您无法基于其内容搜索这些文档。要使这些文件可以搜索,应该使用 OCR 提取其文本。可搜索的 PDF 文档显示页面图像,但在单独的层中也包含识别的文本,其中每个文本字符都引用其图像对应内容。这样就可以搜索 PDF。可搜索的 PDF 对于访问文档中必须通过其精确原始外观存档的内容特别有用。

 

附注

选择“可搜索的 PDF”后,它仅在输入文件中未检测到可访问的文本层时才运行 OCR 过程。如果找到文本层,则将其用于生成常规 PDF,此类 PDF 无需运行 OCR 就可搜索到。即便禁用“可搜索的 PDF”也会搜索到。

 

您使用 Create 助手将只包含图像的 PDF 文件或各类图像文件转换为可搜索的 PDF 文档。

您可以在可搜索的 PDF 转换设置对话框中设置 OCR 语言。

提示

请在 Create 助手中查看受支持文件类型的列表。

 

Create 助手提供一个名为可搜索 PDF 的单独配置文件,不过,您也可以通过选中“可搜索 PDF”复选框,使用其他配置文件创建可搜索的 PDF。

 

在 Create 助手中使用“可搜索的 PDF”配置文件

选项 图标

  1. 在“Create 助手配置文件”选择框中,选择“可搜索的 PDF”。

  2. 打开您希望转换为可搜索 PDF 的一个或多个文件。

  3. 单击“配置文件”按钮,以检查 PDF Create 配置文件对话框中的设置。“可搜索的 PDF”复选框将自动选中。保持此设置,并在需要时更改其他设置(如安全性、水印等)。

  4. 单击“设置”按钮以显示“可搜索的 PDF 转换设置”对话框。选择源文档的语言,然后关闭该对话框。单击“确定”关闭“PDF Create 配置文件”对话框。

  5. Start PDF creation icon
    单击“开始 PDF 创建”工具。如果使用选项“为每个输入文档创建一个 PDF”选择了多个文件,并将“查询文件名”设置为保存选项,则会单独为每个生成的 PDF 文件显示“另存为”对话框。

使用其他配置文件创建可搜索 PDF 的步骤

选项 图标

  1. 在“Create 助手配置文件”选择框中,选择配置文件并加载文件。

  2. 单击“配置文件”按钮。

  3. “PDF Create 配置文件”对话框中,选中“可搜索”复选框。

  4. 单击“设置”按钮以显示“可搜索的 PDF 转换设置”对话框。选择源文档的语言,然后单击“确定”。

  5. 如果需要,在 PDF Create 配置文件对话框中检查并更改其他设置(例如,安全性和水印等)。如上所述,单击“确定”并开始创建。

提示

若要使经过 MRC 压缩后的 PDF 可搜索,请选中这两个复选框。在这种情况下,如果您单击“设置”按钮,则将出现“可搜索的 MRC PDF 转换设置”对话框。

 

 

当您在 Power PDF 中打开仅包含图像的 PDF 文件,或者 PDF 文件中的某些页面仅包含图像时,该程序可自动对此进行检测(“文件”>“选项”>“文档”>“可搜索 PDF 文档”)。要进行该操作,请取消选择相关复选框(默认为选中)。如果提示已经启用,则该程序提供使文档成为以下的选项:

有关更多详细信息,请参阅关于编辑 PDF 文档

 

附注

使 PDF 可搜索 图标

在 Power PDF 中,可以通过“主页”>“转换”下的“制作可搜索的 PDF”命令将仅包含图像 PDF 或者部分页面仅包含图像的 PDF 转换为可搜索的 PDF。您可以在“文件”>“选项”>“文档”>“可搜索的 PDF 文档”中,影响这一转换。选择是针对含有仅包含图像部分的页面还是针对所有页面运行 OCR;如果选择后者,则 PDF 中之前存在的任何文本层内容会替换为 OCR 结果。如果存在文本层但因为不是标准编码而无法使用,则可使用另一选项来运行 OCR。可以校对生成的文本以提高 OCR 过程的准确度。