Tarefa Tornar PDF pesquisável

O OmniPage pode criar arquivos PDF totalmente pesquisáveis a partir de arquivos PDF somente imagem ou de arquivos PDF com partes em imagem. Isso é feito a partir do menu Ferramentas, selecionando-se Assistente eDiscovery para PDF pesquisável. Este processo deixa os comentários e anotações nos arquivos intacto.

O OmniPage Ultimate acrescenta este recurso para criar arquivos PDF pesquisáveis como uma tarefa pré-programada no DocuDirect. Isto pode ser com uma tarefa normal (iniciando imediatamente, em um horário fixo posterior ou com recorrência) ou com uma tarefa de monitoração de pasta.

A entrada deve ser apenas de arquivos PDF – de qualquer tipo. Existem os seguintes cenários:

A entrada é um ou mais...

Resultado:

Arquivos PDF somente imagem

Os arquivos se tornam PDF de imagem pesquisáveis

Arquivos PDF pesquisáveis.

Os arquivos não são alterados.

Arquivos PDF pesquisáveis com páginas ou partes somente imagem.

As partes pesquisáveis permanecem inalteradas; as partes somente imagem se tornam pesquisáveis.

Arquivos PDF pesquisáveis com
partes somente imagem.

As partes do PDF que são ‘Normais’ (ou seja, editáveis) permanecem inalteradas, as partes somente imagem permanecem como imagem, mas se tornam pesquisáveis.

 

Quando você configurar uma pasta monitorada para esta conversão, certifique-se de que apenas arquivos PDF serão introduzidos na pasta. Você pode não saber de antemão se eles são pesquisáveis ou não; o OmniPage detectará isso e produzirá um conjunto de arquivos totalmente pesquisável. Se forem recebidos outros tipos de arquivos de imagem, haverá erro no processamento dos mesmos.

Ao iniciar um Fluxo expresso a partir da caixa de diálogo Carregar Arquivos, selecione apenas arquivos PDF.

Este tipo de tarefa exige que Tornar PDF pesquisável seja uma etapa única do fluxo de trabalho.

Para executar uma tarefa que torne arquivos PDF pesquisáveis

  1. Configure a tarefa como Normal ou Monitoração de Pasta.

  2. Forneça instruções de tempo e clique em Avançar.

  3. O Assistente de Fluxo de Trabalho aparece, oferecendo a etapa Carregar Arquivos.

  4. Clique na seta para baixo para ver todas as etapas possíveis; selecione Tornar PDF pesquisável.

  5. Selecione o idioma do seu documento para o processo de OCR no painel de opções associado.

  6. Selecione um dicionário do usuário, se desejar.

  7. Ative ou desative a caixa de seleção para criar arquivos de backup. Certifique-se de ter uma cópia dos seus arquivos originais se a opção de backup não estiver selecionada.

  8. O botão Avançar fica desativado para este tipo de tarefa. Clique em Concluir.

Este tipo de tarefa não requer um local de salvamento para o resultado porque os arquivos originais são atualizados com o conteúdo de texto reconhecido. Se você optar por ativar o backup, uma cópia do conjunto de arquivos PDF de entrada será criada no local de entrada. O sufixo ‘bak’ será adicionado ao nome desses arquivos:

Meu documento de entrada.pdf

Este é o arquivo de entrada original com conteúdo atualizado.

Meu documento de entrada.bak.pdf

Esta é a cópia backup do original inalterado.

Se uma página PDF já era totalmente pesquisável, a mensagem ‘Nenhuma zona foi localizada’ aparece para a página no painel de resultados da tarefa. Se o arquivo PDF de entrada tiver partes de texto que foram suprimidas, essas partes não serão pesquisáveis.

Esse tipo de tarefa não requer a presença do Kofax Power PDF Create.