Crear archivos PDF con capacidad de búsqueda

Cuando se tiene texto en un archivo PDF compuesto exclusivamente por imágenes o se crean archivos PDF a partir de archivos de imagen que contienen texto, no será posible buscar por contenido dentro de esos documentos. Para dotar a estos archivos de capacidad de búsqueda, es necesario utilizar OCR para extraer su texto. Un documento PDF con capacidad de búsqueda presenta las imágenes correspondientes a las páginas, pero también contiene en una capa separada el texto reconocido, con una referencia entre cada carácter y su imagen correspondiente. Esto permite hacer búsquedas dentro del PDF. Los PDF con capacidad de búsqueda son especialmente útiles para acceder al contenido de documentos que se deben archivar con su apariencia original exacta.

Cuando se selecciona la opción PDF con capacidad de búsqueda, el proceso OCR se ejecuta solamente cuando en un archivo de entrada no se encuentra una capa de texto accesible. Si se encuentra una capa de texto, el programa la utilizará para crear un PDF normal con capacidad de búsqueda, sin necesidad de ejecutar el OCR. Esto será así incluso si está deshabilitada la opción PDF con capacidad de búsqueda.

Utilice el Asistente de Create para convertir archivos PDF de solo imagen o diversos tipos de archivos de imagen en documentos PDF con capacidad de búsqueda.

Vea la lista de tipos de archivos compatibles en el Asistente de Create.

El idioma de OCR se puede configurar en el cuadro de diálogo Configuración de conversión PDF con capacidad de búsqueda.

El Asistente de Create ofrece un perfil independiente cuyo nombre es PDF con capacidad de búsqueda, pero esta clase de documentos PDF también se puede crear con otros perfiles activando la casilla de verificación PDF con capacidad de búsqueda.

Utilizar el perfil PDF con capacidad de búsqueda en el Asistente de Create

  1. En la lista Perfil del Asistente de Create, seleccione PDF con capacidad de búsqueda.
  2. Abra el o los archivos que quiera convertir en PDF con capacidad de búsqueda.
  3. Haga clic en el botón Perfiles y verifique las opciones seleccionadas en el cuadro de diálogo Perfiles de PDF Create. La casilla de verificación PDF con capacidad de búsqueda está seleccionada de forma predeterminada. Conserve esta opción y cambie otras (p. ej., seguridad, marca de agua, etc.) si fuera necesario.
  4. Haga clic en el botón Configuración para ver el cuadro de diálogo Configuración de conversión de PDF con capacidad de búsqueda.
    1. Seleccione el idioma de su documento de origen en la lista Idioma de OCR.
    2. Cambie otros parámetros según sea necesario y, a continuación, haga clic en Aceptar para cerrar el cuadro de diálogo.
  5. Haga clic en Aceptar para cerrar el cuadro de diálogo Perfiles de PDF Create.
  6. Icono Iniciar creación de PDF Haga clic en la herramienta Iniciar creación de PDF.

    El guardado se realiza de acuerdo con la configuración de destino actual. Los archivos PDF resultantes se guardan en la carpeta de origen o en una carpeta predefinida, o bien aparece el cuadro de diálogo Guardar como.

    Un cuadro de diálogo de información muestra el estado del proceso de creación y una lista de los archivos PDF resultantes con el nombre, la ruta, el tipo y la fecha de creación de los archivos.

  7. El cuadro de diálogo Información de impresión de Crear PDF muestra el estado del proceso de creación y una lista de los archivos PDF resultantes con el nombre, la ruta, el tipo y la fecha de creación de los archivos. Haga clic en Cerrar para volver a la ventana Crear PDF, y ciérrela. Haga clic en Cerrar para volver a la ventana Crear PDF, y ciérrela.

Crear PDF con capacidad de búsqueda utilizando otros perfiles en el Asistente de Create

  1. En la lista Perfil del Asistente de Create, seleccione un perfil y cargue archivos.
  2. Haga clic en Perfiles.
  3. En el cuadro de diálogo Perfiles de PDF Create, marque la casilla de verificación Con capacidad de búsqueda.

    Para obtener un PDF con capacidad de búsqueda y compresión MRC, marque las dos casillas de verificación. En este caso, si hace clic en el botón Configuración, aparecerá el cuadro de diálogo Configuración de conversión de PDF MRC con capacidad de búsqueda.

  4. Haga clic en el botón Configuración para ver el cuadro de diálogo Configuración de conversión de PDF con capacidad de búsqueda. Seleccione el idioma del documento de origen y luego haga clic en Aceptar.
  5. En el cuadro de diálogo Perfiles de PDF Create marque y cambie otros parámetros (por ejemplo, seguridad, marca de agua, etc.), de ser necesario.
  6. Haga clic en Aceptar para cerrar el cuadro de diálogo Perfiles de PDF Create.
  7. Icono Iniciar creación de PDF Haga clic en la herramienta Iniciar creación de PDF.

    El guardado se realiza de acuerdo con la configuración de destino actual. Los archivos PDF resultantes se guardan en la carpeta de origen o en una carpeta predefinida, o bien aparece el cuadro de diálogo Guardar como.

  8. Un cuadro de diálogo de información muestra el estado del proceso de creación y una lista de los archivos PDF resultantes con el nombre, la ruta, el tipo y la fecha de creación de los archivos. Haga clic en Cerrar para volver a la ventana Crear PDF, y ciérrela.

Dotar a un archivo PDF con partes de solo imagen de capacidad de búsqueda en Power PDF

Para transformar un PDF de solo imagen o un PDF con partes de solo imagen en un PDF con capacidad de búsqueda en Power PDF, continúe con los pasos siguientes.

Puede elegir esta transformación en Archivo > Opciones > Documento > Documento PDF con capacidad de búsqueda.

  1. Icono Crear PDF con búsqueda Haga clic en Crear PDF con búsqueda en la ficha Inicio de la cinta.
  2. En el cuadro de diálogo Convertir páginas, seleccione si el OCR (reconocimiento óptico de caracteres) se ejecuta únicamente en las páginas con partes de solo imagen o en todas las páginas; en este caso, cualquier contenido con capas de texto que se encuentre previamente en el archivo PDF se reemplazará por los resultados del OCR.
  3. Haga clic en Configuración para ver el cuadro de diálogo Configuración de conversión de PDF con capacidad de búsqueda. Actualice los parámetros más importantes según sea necesario y, a continuación, haga clic en Aceptar para guardar los cambios y volver.

    Para obtener más información sobre la configuración, consulte Acerca de la modificación de documentos PDF.

    1. Seleccione el idioma de su documento de origen en la lista Idioma de OCR.
    2. Seleccione Procesar documentos usando OCR para ejecutar OCR si la capa de texto está presente pero inutilizada debido a una codificación no estándar.
    3. Seleccione Revisar los resultados de forma automática después del OCR para revisar el texto generado para mejorar su precisión después del proceso de OCR.
  4. Haga clic en Aceptar para ejecutar la transformación.