可搜索的 PDF 转换设置

当您执行下面其中一项操作时，将显示此对话框：

如果您需要从图像文件或不可搜索且仅包含图像的 PDF 文件创建可搜索的 PDF，则使用这些设置。请在 Create 助手中查看受支持文件类型的列表。

OCR 语言

从图像中提取文本以使图像文件可搜索到时需要 OCR。选择源文档中显示的语言。

拒绝字符

拒绝字符代表不可识别的字符（默认为波形符： ~）。例如，如果 OCR 无法识别“REJECT”中的“J”，并且“~”是拒绝字符，则您的文档中将会出现字符串“RE~ECT”。

请在“拒绝字符”编辑框中键入您要使用的字符。请尝试选择一个不会在您的文档中出现的字符。

保留原始图像(K)

如果您希望在转换后保持原始图像，则选中此复选框。

自动调整页面方向

选中此复选框可自动设置页面方向（横向或纵向）。

处理页面

选择在将 PDF 文档转换为可搜索 PDF 时要处理的页面。

使用 OCR 处理文档如果您只想通过 OCR 处理文档，请选择此选项。所有页面将在内部转换为位图，然后由 OCR 处理。此方法会丢弃所有非可见和非标准元素（例如被隐藏或覆盖的对象、使用含非标准字符代码的字体的文本），如果无法将标准 PDF 转换为可搜索 PDF，此方法可能有用。
识别非标准编码页选择此选项来处理含自有字体和/或特殊字符编码的页面。

OCR 后自动校对结果

（仅在 Power PDF 中可用。）

选择此选项可对已处理的文档运行交互式拼写检查。单击“用户词典”可添加或创建您自己的词汇表。

自动查找只包含图像的页面（需要重启）

（仅在 Power PDF 中可用。）

如果选中此选项，则 Power PDF 在打开时会检查每个 PDF，如果文档具有仅包含图像的页面，则提供转换为可搜索的 PDF 的功能。检查过程可能很耗时，因此此选项默认为未选中状态。

在通知栏中通知

（仅在 Power PDF 中可用，仅在选中上述复选框时启用。）

选择“在通知栏中通知”，让 Power PDF 在发现纯图像页面时在通知栏（功能区下方）中向发出通知。单击“实现可搜索”显示“自动检测”对话框，选择应用于纯图像页面的 OCR 选项。

取消勾选“在通知栏中通知”，让 Power PDF 在发现纯图像页面时不显示通知，而显示“自动检测”对话框。

附注

当输入文件是文本文件或者包含可访问的文本层时，无需运行 OCR 即可创建常规的可搜索 PDF，所以在这些情况下不需要使用 OCR 语言和拒绝字符设置。