Sprachauswahl
Die Anwendung unterstützt bei der PDF-Konvertierung über hundert Sprachen mit lateinischem, griechischem und kyrillischem Alphabet. Wenn Sie Seiten mit einer Textebene konvertieren, ist die Sprachauswahl nicht von besonderer Bedeutung. Wenn Sie jedoch selbst die OCR einleiten, z. B. bei der Verarbeitung von Nur-Bild-Seiten und zur Erkennung von Text ohne Standardkodierung, ist die Sprachauswahl ein wichtiger Schritt.
Nachstehend die vollständige Liste der unterstützten Sprachen. Sprachen mit Wörterbuchunterstützung sind fett hervorgehoben:
Afrikaans, Aimara, Albanisch, Arabisch, Baskisch, Bemba, Blackfoot, Bretonisch, Bugotu, Bulgarisch, Chamorro, Chinesisch (Vereinfacht), Chinesisch (Traditionell), Crow, Dänisch, Deutsch, Englisch, Esperanto, Estnisch, Faröisch, Fidschi, Finnisch, Französisch, Friaulisch, Friesisch, Gälisch (Irisch), Gälisch (Schottisch), Galizisch, Ganda, Griechisch, Guarani, Hani, Hawaiianisch, Ido, Indonesisch, Interlingua, Inuit, Isländisch, Italienisch, Japanisch, Kabardinisch, Kaschubisch, Katalanisch, Kawa, Kikuyu, Kongo, Koreanisch, Korsisch, Kpelle, Kroatisch, Kurdisch, Latein, Lettisch, Litauisch, Luba, Lulesamisch, Luxemburgisch, Malagassi, Malaiisch, Malinke, Maltesisch, Maori, Maya, Miao, Minangkabauisch, Mohawk, Moldawisch, Nahuatl, Niederländisch, Nordsamisch, Norwegisch, Nyanja, Ojibway, Okzitanisch, Papiamento, Pidgin-Englisch, Polnisch, Portugiesisch (Brasilianisch), Portugiesisch (Standard), Provenzalisch, Quechua, Rätoromanisch, Romani, Ruanda, Rumänisch, Rundi, Russisch, Samisch, Südsamisch, Samoanisch, Sardisch, Schwedisch, Serbisch (kyr. Alphabet), Serbisch (lat. Alphabet), Shona, Sioux, Slowakisch, Slowenisch, Somali, Sorbisch (Wendisch), Sotho, Spanisch, Suaheli, Sudanesisch, Swasi, Tagalog, Tahitisch, Tongaisch, Tschechisch, Tschetschenisch, Tswana, Tun, Türkisch, Ukrainisch, Ungarisch, Visayanisch, Walisisch, Weißrussisch, Wolof, Xhosa, Zapotec und Zulu.
Die höchste Erkennungsgenauigkeit erzielen Sie, wenn Sie im Dialogfeld OCR-Einstellungen nur die Sprachen auswählen, die im Dokument enthalten sind. Bei Auswahl mehrerer Sprachen gelten folgende Einschränkungen:
-
Wählen Sie entweder eine einzige asiatische Sprache oder eine bzw. mehrere Sprachen mit lateinischem oder kyrillischem Alphabet.
-
Asiatische Sprachen können nicht mit anderen Sprachen kombiniert werden.
-
Falls Ihr Dokument gegen diese Beschränkungen verstößt, markieren Sie stattdessen die Option Automatische Erkennung der Dokumentsprache.
-
Klicken Sie auf Auswahl aufheben, um die Liste zurückzusetzen und eine neue Auswahl vorzunehmen.
Die Option Automatische Erkennung der Dokumentsprache ist für die unbeaufsichtigte Verarbeitung vorgesehen. Diese Funktion analysiert den Inhalt jedes Quelldokuments und ordnet jeder Dokumentseite eine Sprache zu, wobei aus denjenigen ausgewählt wird, die oben fett hervorgehoben sind. Wenn die automatische Sprachenerkennung festgelegt ist, kann keine andere Sprache ausgewählt werden.
Die Option Automatische Erkennung der Dokumentsprache kann keine verschiedenen Sprachen auf ein und derselben Seite erkennen und zuordnen. Das Programm kann Folgendes ausführen: Alle bekanntermaßen in einem Dokument vorhandenen Sprachen manuell auswählen und alle Texte in dem Dokument mithilfe einer internen Erkennungsfunktionen diesen Sprachen zuordnen.