PDF-файлы с поддержкой поиска и проверка

PDF-файл, полученный в результате сканирования, содержит только изображения страниц. В Power PDF такие чисто графические PDF-документы можно превратить в файлы с возможностью поиска. Для этого используется технология оптического распознавания текста (OCR). Добиться более точных результатов также помогает проверка.

 

Как сделать содержимое PDF-файла доступным для поиска

 

значок PDF с возможностью поиска

Выберите «Домой» > «Преобразование» > PDF с возможностью поиска.

 

Укажите параметры, как описано в разделе Параметры преобразования PDF с поддержкой поиска.

 

Повысить точность оптического распознавания помогает проверка. В ходе распознавания для каждого проанализированного символа и каждого слова определяется уровень достоверности. Слова, которые вызывают сомнение, помечаются для проверки. В верхней части панели проверки (А) находится изображение слова или строки. На следующей панели (Б) показан текущий вариант, а на нижней панели (В) перечислены альтернативные предложения, которые выбираются из словаря. С помощью кнопок справа сохраните текущий вариант или выберите одно из предложений. Если ни один из вариантов не подходит, введите правильное слово или строку в поле Сомнительное слово и нажмите кнопку ОК. С помощью кнопки Документ готов (Г) можно завершить проверку до достижения конца документа. С помощью кнопки Страница готова (Д) можно пропустить оставшийся текст на текущей странице и перейти к следующей. Установите флажок Показать распознанный текст в документе (Е), чтобы сделать текстовый слой видимым и обесцветить слой исходного изображения. В некоторых случаях это облегчает чтение.

 

панель проверки с помеченными областями, описанными в тексте

 

С помощью кнопок справа можно управлять предлагаемыми вариантами.

 

Пропустить: нажмите эту кнопку, если текущий вариант правильный. Средство проверки перейдет к следующему сомнительному слову.

Пропустить все: нажмите эту кнопку, чтобы считать все остальные такие же сомнительные слова правильными.

Не текст: модуль оптического распознавания может посчитать текстом рисунки или схемы. С помощью этой кнопки можно удалить предлагаемый текстовый вариант.

Добавить: принять выбранный вариант и добавить его в текущий словарь.

Изменить: принять выбранный вариант.

Изменить все: принять выбранный вариант и использовать его для всех остальных экземпляров этого слова. 

 

Если ни один из предлагаемых вариантов не подходит, введите правильный текст в поле редактирования и нажмите Изменить или Изменить все.

 

Включить или отключить запуск проверки каждый раз при преобразовании PDF-файла в документ с возможностью поиска можно в разделе «Файл» > «Параметры» > «Документ» > «Документ PDF с возможностью поиска». 

 

Здесь же можно выбрать язык для распознавания. Для многих языков есть встроенные словари. Вы можете указать пользовательский словарь в дополнение к встроенному либо для распознавания текста на языках, для которых нет словарей. 

Если автоматическая проверка не включена, ее можно выполнить для отдельного файла с помощью команды «Домой» > «PDF с возможностью поиска» > «Модуль проверки».

 

Документы PDF с возможностью поиска также можно создавать с помощью PDF Create.