Если в PDF-файлах, содержащих только изображения, имеется текст или PDF-файлы создаются на основе файлов изображений, содержащих текст, поиск по содержимому этих документов невозможен. Чтобы сделать возможным поиск по таким файлам, необходимо извлечь текст с помощью функции распознавания текста. PDF-документ с возможностью поиска представляет собой изображения страниц, а в отдельном слое содержит распознанный текст, каждый символ которого ссылается на соответствующий символ в изображении. Это обеспечивает возможность поиска по PDF-документу. PDF-документы с возможностью поиска особенно полезны для представления содержимого документов, которые необходимо заархивировать, в точности сохранив их исходный вид.
Примечание
При установленном флажке PDF с возможностью поиска процесс оптического распознавания текста запускается только в том случае, если во входном файле не удается обнаружить доступный текстовый слой. Если таковой найден, он используется для создания обычного PDF-документа с возможностью поиска без оптического распознавания текста. Это происходит даже в том случае, если флажок PDF с возможностью поиска снят.
С помощью программы Create Assistant PDF-файлы, содержащие только изображения, и файлы изображений различных типов можно преобразовывать в PDF-документы с возможностью поиска.
Язык для распознавания текста можно указать в диалоговом окне Параметры преобразования PDF с поддержкой поиска.
Совет
Список поддерживаемых типов файлов см. в разделе Create Assistant.
В Create Assistant имеется отдельный профиль, который называется «PDF с возможностью поиска», однако для создания PDF-документов с возможностью поиска можно использовать и другие профили, установив флажок PDF с возможностью поиска.
Использование профиля «PDF с возможностью поиска» в Create Assistant
В поле «Профиль» в Create Assistant выберите профиль PDF с возможностью поиска.
Откройте один или несколько файлов, которые нужно преобразовать в PDF-файлы с возможностью поиска.
Нажмите кнопку Профили, чтобы проверить параметры в диалоговом окне Профили PDF Create. Флажок PDF с возможностью поиска будет установлен автоматически. Сохраните его без изменений и при необходимости измените остальные параметры (например, параметры безопасности, водяного знака и т. д.).
Нажмите кнопку Параметры, чтобы открыть диалоговое окно Параметры преобразования PDF с поддержкой поиска. Укажите язык исходного документа и закройте диалоговое окно. Нажмите кнопку «ОК», чтобы закрыть диалоговое окно «Профили PDF Create».
Выберите инструмент Запустить создание PDF. Если выбрать несколько файлов с заданным параметром Создать PDF для каждого из входных документов и задать параметр сохранения Запросить имя файла, диалоговое окно «Сохранить как» будет появляться отдельно для каждого сгенерированного PDF-файла.
Чтобы создать PDF-документ с возможностью поиска с использованием других профилей, выполните указанные ниже действия.
Выберите профиль в поле «Профиль» в Create Assistant и загрузите файлы.
Нажмите кнопку Профили.
В диалоговом окне Профили PDF Create установите флажок С возможностью поиска.
Нажмите кнопку Параметры, чтобы открыть диалоговое окно Параметры преобразования PDF с поддержкой поиска. Выберите язык исходного документа и нажмите кнопку «ОК».
В диалоговом окне Профили PDF Create проверьте и при необходимости измените другие параметры (например, параметры безопасности, водяного знака и т. д.). Нажмите кнопку «ОК» и запустите процесс создания, как описано выше.
Совет
Чтобы получить PDF-документ с возможностью поиска со сжатием MRC, необходимо установить оба флажка. В этом случае при нажатии кнопки Параметры будет открыто диалоговое окно Параметры преобразования MRC PDF с поддержкой поиска.
Программу Power PDF можно настроить так, чтобы при открытии PDF-файла только с изображениями или файла, который содержит только страницы с изображениями, она автоматически обнаруживала это («Файл» > «Параметры» > «Документ» > «Документы PDF с возможностью поиска»). Для этого снимите соответствующий флажок (по умолчанию он установлен). Если соответствующая функция включена, программа предлагает выбрать один из указанных ниже типов итогового документа.
PDF с возможностью поиска. При этом будут сохранены оригинальные изображения страниц, их вид останется неизменным, но будет добавлен текстовый слой с возможностью поиска.
Обычный PDF. Будет создан текст и сохранены рисунки, но исходные изображения страниц будут удалены.
Форма PDF. Такое преобразование выполняется с помощью средства автозаполнения форм для создания активных элементов управления формы.
PDF-файл. Файл остается без изменений.
Дополнительные сведения см. в разделе Редактирование PDF-документов.
Примечание
В программе Power PDF можно преобразовать PDF-файл, представляющий собой изображение или содержащий только изображения, в PDF-файл с возможностью поиска с помощью команды PDF с возможностью поиска в разделе «Домой» > «Преобразование». Чтобы изменить параметры этого преобразования, выберите «Файл» > «Параметры» > «Документ» > «Документы PDF с возможностью поиска». Укажите, для каких страниц следует выполнять распознавание текста: для содержащих только изображения или для всех. В последнем случае все содержимое текстовых слоев, имеющееся в PDF-файле, будет заменено результатами распознавания. При выборе первого параметра оптическое распознавание будет выполняться, если текстовый слой присутствует, но непригоден из-за нестандартной кодировки. Полученный текст можно проверить, чтобы удалить ошибки, которые могли возникнуть при распознавании.