El reconocimiento óptico de caracteres (OCR) es el proceso de extracción de texto a partir de la imagen de una página. Esta imagen de página es una imagen electrónica de texto y puede contener otros elementos tales como encabezados e imágenes. Las imágenes de páginas pueden obtenerse a partir de la digitalización de un documento en papel o de la apertura de un archivo electrónico de imagen. Podrá recibir estos archivos por correo electrónico o desde una máquina de fax, o bien desde su propio escáner.
Las imágenes no tienen caracteres de texto modificable; tienen muchos puntos pequeños (píxeles) que, en conjunto, forman una imagen del texto. El proceso de OCR examina la imagen de texto y crea a partir de él texto modificable en ordenador, de modo que no tenga que reescribir manualmente el texto.
El OCR toma una imagen:
y crea texto: 
Durante el OCR, OmniPage utiliza los parámetros seleccionados en la Caja de herramientas de OmniPage para determinar el flujo de texto de una página, y crea zonas ordenadas alrededor de áreas de una página para identificar las zonas que se reconocerán como texto o se retendrán como gráfico. Tras el OCR, se puede guardar el texto resultante en formatos compatibles con una gran variedad de aplicaciones de procesamiento de texto, diseño de página y hojas de cálculo.
Además del reconocimiento de texto, OmniPage puede mantener los siguientes elementos en un documento durante el OCR.
Ejemplos de gráficos son las fotografías, logotipos y diagramas.
Los tipos, tamaños y estilos de fuente (por ejemplo, negrita o cursiva) son ejemplos de formato de caracteres de texto. El espaciado entre párrafos, sangrías, tabulaciones, espaciado entre líneas y alineación son ejemplos de formato de párrafo.
La estructura de columnas, la colocación de párrafos, la manipulación de tablas y las posiciones de gráficos son ejemplos de formato de página.
Los resultados del reconocimiento se colocan en el Editor de texto. El editor ofrece tres vistas y permite definir la cantidad de formato que desee ver.
OmniPage sólo reconoce caracteres impresos a máquina como, por ejemplo, texto mecanografiado o impreso con láser. Sin embargo, puede mantener texto manuscrito, tal como una firma, como un gráfico.