Paramètres de conversion en PDF avec recherches

Cette boîte de dialogue s'affiche si vous effectuez l'une des opérations suivantes :

Cliquez sur le bouton Paramètres dans la boîte de dialogue Profils PDF Create avec la case Avec recherches cochée.
Cliquez sur Convertir > Autre > PDF avec recherches, puis cliquez sur Paramètres dans la boîte de dialogue Conversion de pages.
Consultez les options du processus OCR dans Fichier > Options > Document > Document PDF avec recherches.

Utilisez ces paramètres pour créer des PDF avec recherches à partir de fichiers image ou de fichiers PDF constitués uniquement d'images sans possibilité de recherche. Reportez-vous à la rubrique Assistant Create pour connaître les types de fichier pris en charge.

Langue d'OCR

Le processus d'OCR permet d'extraire le texte contenu dans des images, afin de pouvoir y lancer des recherches de texte. Sélectionnez la langue dans laquelle votre document source est rédigé.

Caractère de rejet

Les caractères dont la reconnaissance a échoué sont remplacés par un caractère de rejet (un tilde : ~ par défaut). Par exemple, si l'OCR ne reconnaît pas la lettre J du mot REJET et que ~ est le caractère de rejet, le texte RE~ET apparaît dans votre document.

Saisissez le caractère de votre choix dans le champ Caractère de rejet. Veillez à sélectionner un caractère qui ne risque pas d'apparaître dans vos documents.

Conserver les images d'origine

Cochez cette case pour conserver l'image d'origine après la conversion.

Orientation automatique des pages

Cochez cette case pour que le programme choisisse automatiquement l'orientation de la page (paysage ou portrait).

Pages à traiter

Sélectionnez les pages à traiter lors de la conversion d'un document en PDF avec recherches.

Pages constituées uniquement d'images : Par défaut, Power PDF traite uniquement les pages qui incluent uniquement du contenu image (bitmap), sans calque de texte.
Toutes les pages : Sélectionnez cette option pour traiter toutes les pages, quel que soit leur contenu.
- Traiter les documents par OCR : Sélectionnez cette option pour traiter les documents uniquement par OCR. En interne, toutes les pages sont converties au format bitmap, puis traitées par l'OCR. Cette méthode supprime tous les éléments non visuels et non standard (tels que les objets cachés ou entourés, ou les textes contenant des polices basées sur des codes de caractères non standard). Elle peut s'avérer utile si la procédure de conversion standard des documents en PDF avec recherches a échoué.
- Reconnaître les pages non codées en standard : Sélectionnez cette option pour traiter les pages contenant leurs propres polices et/ou un codage de caractères spécifique.

Vérifier automatiquement les résultats après OCR

(Accessible uniquement dans Power PDF) Sélectionnez cette option pour exécuter l'outil de vérification orthographique interactif sur le document traité. Cliquez sur Dictionnaires utilisateur pour ajouter ou créer vos propres vocabulaires.

Rechercher automatiquement les pages constituées uniquement d'images (redémarrage requis)

(Accessible uniquement dans Power PDF) Si cette option est sélectionnée, Power PDF vérifie chaque document PDF dès qu'il est ouvert et propose de le convertir en PDF avec recherches s'il contient des pages constituées uniquement d'images. La procédure de vérification pouvant durer plusieurs minutes, cette option n'est pas sélectionnée par défaut.

Informer dans la barre de notification

(Accessible uniquement dans Power PDF, activé seulement si la case précédente est cochée.) Sélectionnez l'option « Informer dans la barre de notification » pour que Power PDF vous avertisse, dans la barre de notification (sous le ruban), en cas de détection de pages constituées uniquement d'images. Cliquez sur Convertir en document autorisant les recherches pour afficher la boîte de dialogue Détection automatique et choisissez dans les options d'appliquer l'OCR aux pages constituées uniquement d'images.

Décochez l'option « Informer dans la barre de notification » pour que Power PDF affiche directement la boîte de dialogue Détection automatique dès que des pages constituées uniquement d'images sont détectées.

Si le fichier d'entrée est un fichier texte, ou s'il possède un calque de texte accessible, un PDF avec recherches standard est créé sans que le moteur d'OCR n'intervienne. Les paramètres Langue d'OCR et Caractère de rejet n'ont alors aucune incidence.