可搜索的 PDF 转换设置
当您执行下面其中一项操作时,将显示此对话框:
- 单击PDF Create“配置文件”对话框中的“设置”按钮,并选中“可搜索”复选框。
- 单击转换 > 其他 > 可搜索的 PDF,然后在转换页面对话框中单击设置。
- 在“文件”>“选项”>“文档”>“可搜索的 PDF 文档”下查看 OCR 过程的首选项。
如果您需要从图像文件或不可搜索且仅包含图像的 PDF 文件创建可搜索的 PDF,则使用这些设置。请在 Create 助手中查看受支持文件类型的列表。
OCR 语言
从图像中提取文本以使图像文件可搜索到时需要 OCR。选择源文档中显示的语言。
拒绝字符
拒绝字符代表不可识别的字符(默认为波形符: ~)。例如,如果 OCR 无法识别“REJECT”中的“J”,并且“~”是拒绝字符,则您的文档中将会出现字符串“RE~ECT”。
请在“拒绝字符”编辑框中键入您要使用的字符。请尝试选择一个不会在您的文档中出现的字符。
保留原始图像(K)
如果您希望在转换后保持原始图像,则选中此复选框。
自动调整页面方向
选中此复选框可自动设置页面方向(横向或纵向)。
处理页面
选择在将 PDF 文档转换为可搜索 PDF 时要处理的页面。
- 只包含图像的页面:默认情况下,Power PDF 只处理包含图像(位图)内容而不含文本层的页面。
- 所有页面选择此选项可处理页面,而无论构成组件如何。
- 使用 OCR 处理文档如果您只想通过 OCR 处理文档,请选择此选项。所有页面将在内部转换为位图,然后由 OCR 处理。此方法会丢弃所有非可见和非标准元素(例如被隐藏或覆盖的对象、使用含非标准字符代码的字体的文本),如果无法将标准 PDF 转换为可搜索 PDF,此方法可能有用。
- 识别非标准编码页选择此选项来处理含自有字体和/或特殊字符编码的页面。
OCR 后自动校对结果
(仅在 Power PDF 中可用。)
选择此选项可对已处理的文档运行交互式拼写检查。单击“用户词典”可添加或创建您自己的词汇表。
自动查找只包含图像的页面(需要重启)
(仅在 Power PDF 中可用。)
如果选中此选项,则 Power PDF 在打开时会检查每个 PDF,如果文档具有仅包含图像的页面,则提供转换为可搜索的 PDF 的功能。检查过程可能很耗时,因此此选项默认为未选中状态。
在通知栏中通知
(仅在 Power PDF 中可用,仅在选中上述复选框时启用。)
选择“在通知栏中通知”,让 Power PDF 在发现纯图像页面时在通知栏(功能区下方)中向发出通知。单击“实现可搜索”显示“自动检测”对话框,选择应用于纯图像页面的 OCR 选项。
取消勾选“在通知栏中通知”,让 Power PDF 在发现纯图像页面时不显示通知,而显示“自动检测”对话框。
附注
当输入文件是文本文件或者包含可访问的文本层时,无需运行 OCR 即可创建常规的可搜索 PDF,所以在这些情况下不需要使用 OCR 语言和拒绝字符设置。