Lorsqu'il convertit les fichiers, le programme peut gérer plus de cent langues utilisant l'alphabet latin, grec ou russe. Lors de la conversion de pages comportant un calque de texte, le choix de la langue n'est pas aussi important. Vous verrez véritablement la différence lorsque vous avez choisi de traiter un fichier par OCR : pour gérer les pages constituées uniquement d'images ou du texte utilisant un encodage spécifique.
Vous trouverez ci-dessous la liste complète des langues prises en charge. Les langues associées à un dictionnaire sont affichées en gras :
Afrikaans, Albanais, Allemand, Anglais, Aymara, Basque, Bemba, Biélorusse, Blackfoot, Breton, Bugotu, Bulgare, Catalan, Chamorro, Chinois (simplifié), Chinois (traditionnel), Coréen, Corse, Croate, Crow, Danois, Espagnol, Espéranto, Estonien, Féroïen, Fidjien, Finnois, Français, Frioulan, Frison, Gaélique (écossais), Gaélique (irlandais), Galicien, Gallois, Ganda, Grec, Guarani, Hani, Hawaïen, Hongrois, Ido, Indonésien, Interlingua, Inuit, Islandais, Italien, Japonais, Kabarde, Kasub, Kawa, Kikuyu, Kongo, Kpelle, Kurde, Latin, Letton, Lituanien, Luba, Luxembourgeois, Malais, Malgache, Malinka, Maltais, Maori, Maya, Miao, Minangkabau, Mohawk, Moldave, Nahuatl, Néerlandais, Norvégien, Nyanja, Occidental, Ojibwa, Papiamento, Pidgin, Polonais, Portugais (brésilien), Portugais (standard), Provençal, Quechua, Rhaetic, Romani, Roumain, Ruanda, Rundi, Russe, Sami, Sami du nord, Sami du sud, Sami Lule, Samoan, Sarde, Serbe (cyrillique), Serbe (latin), Shona, Sioux, Slovaque, Slovène, Somali, Sorabe (Wend), Sotho, Soudanais, Suédois, Swahili, Swazi, Tagalog, Tahitien, Tchèque, Tchétchène, Tongan, Tswana, Tun, Turc, Ukrainien, Visayan, Wolof, Xhosa, Zapoteco et Zoulou.
Pour bénéficier d'une précision d'OCR optimale, ne sélectionnez dans la boîte de dialogue Paramètres d'OCR que les langues dans lesquelles votre document est rédigé. Plusieurs langues peuvent être sélectionnées, avec les limites suivantes :
Sélectionnez une seule langue asiatique, ou une ou plusieurs langues utilisant l'alphabet latin ou cyrillique.
Il n'est pas possible de sélectionner à la fois une langue asiatique et une langue utilisant l'alphabet latin ou cyrillique.
Astuce
Si votre document mêle des textes asiatiques et des textes utilisant l'alphabet latin, cochez la case Détection automatique de la langue.
Cliquez sur 'Désélectionner tout' pour effacer la liste et refaire votre sélection.
L'option Détection automatique de la langue est conçue pour réaliser des traitements sans intervention manuelle. Elle analyse le contenu de chaque document source et attribue une langue à chaque page, parmi les langues apparaissant en gras dans la liste ci-dessus. Lorsque la détection automatique est activée, aucune langue ne peut être choisie.
Astuce
L'option Détection automatique de la langue n'est pas conçue pour identifier et isoler les différentes langues au sein d'une même page. Le programme permet de sélectionner manuellement toutes les langues identifiées dans le document ; tout le texte du document sera affecté à l'une de ces langues par l'outil de détection intégré.