Integrovaná funkce OCR

OCR představuje proces extrahování textu z obrázku. Tento obrázek může být například výsledkem skenování papírového dokumentu, otevření souboru elektronického obrázku nebo soubor PDF. Obrázky neobsahují upravitelné textové znaky, obsahují mnoho malých teček (pixelů), které společně vytváří tvary znaků. Tyto znaky představují obrázek textu na stránce.

 

Z obrázku znaku ...  

... k upravitelnému textu

Obrázek položky Pixelované písmeno S

Obrázek položky Upravitelný znak S