Når programmet utfører konverteringer, kan det håndtere over hundre språk skrevet med latinsk, gresk eller kyrillisk alfabet. Når sider med et tekstlag konverteres, er språkvalget vanligvis ikke så viktig. Det spiller en betydelig rolle når du kjører OCR for å: håndtere sider med bare bilder eller tekst med et ikke-standard kodesett.
Her er en fullstendig liste over språkene som støttes: De med ordbokstøtte vises i fet skrift:
Afrikaans, albansk, aymara, baskisk, bemba, blackfoot, bretonsk, bugotu, bulgarsk, hviterussisk, katalansk, chamorro, tsjetsjensk, korsikansk, kroatisk, crow, tsjekkisk, dansk, nederlandsk, engelsk, esperanto, estisk, færøysk, fijiansk, finsk, fransk, frisisk, friulisk, gælisk (irsk), gælisk (skotsk), galisisk, ugandisk, tysk, gresk, guaraní, hani, hawaiisk, ungarsk, islandsk, ido, indonesisk, interlingua, inuittisk, italiensk, kabardisk, kasubisk, kawa, kikuyu, kongolesisk, kpelle, kurdisk, latin, latvisk, litauisk, luba, luxembourgsk, gassisk, malayisk, malinke, maltesisk, maori, maya, miao, minankabaw, mohawk, moldavsk, nahuatl, norsk, nyanja, oksidentalsk, ojibway, papiamento, pidgin-engelsk, polsk, portugisisk (standard), portugisisk (brasiliansk), provencalsk, quechua, retisk, rumensk, romani, rwandisk, rundi, russisk, samisk, lulesamisk, nordsamisk, sørsamisk, samoansk, sardinsk, serbisk (kyrillisk), serbisk (latinsk), shona, sioux, slovakisk, slovensk, somalisk, sorbisk (vendisk), sotho, spansk, sudanesisk, swahili, swazi, svensk, tagalogisk, tahitisk, tongansk, tswana, tun, tyrkisk, ukrainsk, visaya, walisisk, wolof, shosa, zapotec, zulu, japansk, kinesisk (forenklet), kinesisk (tradisjonell) og koreansk.
Hvis du vil oppnå optimal OCR-nøyaktighet, går du til dialogboksen OCR-innstillinger og velger bare språkene som dokumentet inneholder. Valg av flere språk er tillatt med følgende begrensninger:
Velg enten kun ett enkelt asiatisk språk eller et eller flere språk som bruker det latinske eller kyrilliske alfabetet.
Asiatiske språk kan ikke blandes med andre språk.
Tips
Velg isteden avmerkingsboks for automatisk språkutvelgelse, hvis dokumentene overgår disse begrensningene.
Klikk på deaktiver alle for å tilbakestille listen og starte om utvalget ditt.
Alternativet Automatisk gjenkjenning av språk er beregnet for uovervåket behandling. Det analyserer innholdet i hvert kildedokument og tildeler ett språk til hver side. Det velger mellom de som vises i fet skrift i listen over. Når automatisk gjenkjenning er aktivert, er ingen andre språkvalg mulig.
Tips
Alternativet Automatisk gjenkjenning av språk er ikke beregnet på å identifisere og skille mellom forskjellige språk på én enkelt side. Programmet kan gjøre dette: velg alle språk som vites å være i dokumentet manuelt. All tekst i dokumentet blir tildelt ett av disse språkene, basert på en intern gjenkjenningsfunksjon.