Sisäinen optinen tekstintunnistus (OCR)
Optista tekstintunnistusta käytetään tekstin poimimiseen kuvasta. Kuva voi olla peräisin skannatusta paperiasiakirjasta, sähköisestä kuvatiedostosta tai PDF-tiedostosta. Kuvissa ei ole muokattavia tekstimerkkejä vaan paljon pieniä pisteitä (kuvapisteitä), jotka muodostavat merkkien muodot. Ne edustavat tekstin kuvaa sivulla.
Merkin kuvasta... |
...muokattavaan tekstiin |