OCR er prosessen som trekker ut tekst fra bilder. Dette bildet kan komme fra skanning av et papirdokument eller fra åpning av en bildefil eller en PDF-fil. Tekstbilder som ikke har redigerbare teksttegn, har i stedet små prikker (piksler) som sammen danner skrifttegnformer. Disse representerer et bilde med tekst på en side.
|
Fra tegnbilde... |
...til redigerbar tekst |
|
|
|