OCR (Reconnaissance Optique de Caractères)

Utiliser l'OCR dans Kofax Power PDF for Mac

L'OCR (reconnaissance optique de caractères) est le processus de conversion d'une image bitmap de texte (comme un document numérisé) en texte qui peut être sélectionné, copié et recherché par Kofax Power PDF for Mac et d'autres logiciels d'édition de texte. Une fois que le texte a été reconnu par l'OCR, il est placé sur une couche invisible au-dessus de l'image du texte que vous pouvez voir. Lorsque vous copiez du texte, le texte est copié à partir de cette couche invisible d'OCR. La technologie OCR ne produira pas un rendu parfait du texte en bitmap. Vous devrez relire et éditer le texte qui résulte de l'OCR.

OCR automatique

  1. Ouvrir un PDF numérisé dans Kofax Power PDF for Mac.
  2. Une boîte d'alerte s'ouvre avec le message :
    "Ce document semble avoir été numérisé. Souhaitez-vous effectuer une reconnaissance optique de caractères (OCR) sur celui-ci ? L'OCR vous permettra de sélectionner le texte."
  3. Vous avez trois options :
  • Annuler : Aucun OCR ne sera effectué.
  • Page OCR : L'OCR sera effectué sur la page actuelle.
  • Document OCR : Si votre document comporte plusieurs pages, l'OCR sera effectué sur toutes les pages.

Choisissez les langues reconnues par l'OCR dans Préférences > OCR.(Préférences de l'utilisateur).

Pendant que Kofax Power PDF for Mac effectue l'OCR, une barre de progression s'affiche. L'opération peut prendre quelques secondes ou beaucoup plus, selon la taille et le contenu du document numérisé.

OCR manuel

Pour effectuer l'OCR manuellement, choisissez Édition > Page OCR. Kofax Power PDF for Mac commence à effectuer l'opération d'OCR et la barre de progression apparaît.

Forcer l'OCR

Kofax Power PDF for Mac examine le document et s'il voit une image de la taille d'une page, il suppose que le document est un scan et propose automatiquement d'effectuer une OCR. Dans certains cas, Kofax Power PDF for Mac peut ne pas reconnaître un document numérisé. Dans le menu Édition, l'option Page OCR sera grisée et ne pourra pas être sélectionnée.

  1. Maintenez les touches Commande et Option enfoncées simultanément.
  2. Choisissez Édition > Page OCR dans le menu.

OCR par lots

(Fonctionnalité avancée de Kofax Power PDF for Mac). Voir OCR par lots.

Conseils pour améliorer les résultats de l'OCR

  • La qualité du document original affecte la qualité des performances de l'OCR. Des originaux propres et nets, avec un texte clair, donneront de bien meilleurs résultats que des photocopies froissées et fanées.
  • Placez votre document original sur le scanner aussi droit que possible. Si vous avez une page numérisée qui n'est pas droite, vous pouvez "redresser", ou étirer, l'image dans Kofax Power PDF for Mac en choisissant Édition > Redresser et Ajuster l'Image...
  • Augmentez le contraste de votre document numérisé afin que le fond soit aussi blanc que possible. Vous pouvez ajuster le contraste de l'image en allant dans Edition> Redresser et Ajuster l'Image...

Dictionnaires et OCR

Les dictionnaires médicaux et juridiques sont inclus dans le moteur d'OCR de Kofax Power PDF for Macpour améliorer la qualité de la sortie OCR des documents numérisés en reconnaissant les mots spécifiques aux professions médicales et juridiques. Cette fonction est intégrée, il n'est donc pas nécessaire de l'activer ou de régler un quelconque paramètre. Si vous choisissez de modifier le texte OCR, les mots mal orthographiés du texte sélectionné peuvent s'afficher avec un soulignement rouge.