Sisäinen optinen tekstintunnistus (OCR)

Optista tekstintunnistusta käytetään tekstin poimimiseen kuvasta. Kuva voi olla peräisin skannatusta paperiasiakirjasta, sähköisestä kuvatiedostosta tai PDF-tiedostosta. Kuvissa ei ole muokattavia tekstimerkkejä vaan paljon pieniä pisteitä (kuvapisteitä), jotka muodostavat merkkien muodot. Ne edustavat tekstin kuvaa sivulla.

 

Merkin kuvasta...  

...muokattavaan tekstiin

kuva kohteesta pikselöitynyt S-kirjain

kuva kohteesta Muokattava kirjain S