Conversie-instellingen voor doorzoekbare PDF's

Ga als volgt te werk om dit dialoogvenster te openen:

  • Klik op de knop Instellingen in het dialoogvenster PDF Create Profielen terwijl het selectievakje Doorzoekbaar is ingeschakeld.
  • Klik op Converteren > Andere > Doorzoekbare PDF en klik in het dialoogvenster Pagina's converteren op Instellingen.
  • Geef voorkeuren voor het OCR-proces op via Bestand > Opties > Document > Doorzoekbaar PDF-document.

Gebruik deze instellingen als u een doorzoekbare PDF wilt maken van afbeeldingsbestanden of van PDF-bestanden met alleen beeld die niet doorzoekbaar zijn. Zie de lijst met ondersteunde bestandstypen in de Create-assistent.

 

OCR-taal

Met OCR wordt de tekst uit de beelden gehaald, zodat beeldbestanden doorzoekbaar worden. Selecteer de taal van het brondocument.

 

Teken voor niet-herkend

Onherkenbare tekens worden aangeduid met een speciaal teken (standaard een tilde ~). Als tijdens de OCR de M in COMPUTER niet wordt herkend en u als teken voor niet-herkende tekst de tilde (~) gebruikt, ziet u in het document CO~PUTER.

Typ in het invoervak Teken voor niet-herkend het teken dat u wilt gebruiken. Probeer een teken te kiezen dat normaliter niet in uw documenten verschijnt.

 

Oorspronkelijke beelden behouden

Selecteer deze optie als u na de conversie het oorspronkelijke beeld wilt behouden.

 

Pagina's automatisch oriënteren

Schakel dit selectievakje in om de afdrukstand automatisch in te stellen (Liggend of Staand).

 

Pagina's die worden verwerkt

Selecteer welke pagina's u wilt verwerken wanneer u het PDF-document converteert om het doorzoekbaar te maken.

  • Pagina's met alleen beeld: Standaard worden in Power PDF alleen pagina's verwerkt zonder tekstlaag, met alleen beeld (bitmap).
  • Alle pagina's: Selecteer deze optie als u pagina's wilt verwerken ongeacht uit welke componenten ze bestaan.
    • Documenten verwerken met OCR: Selecteer deze optie als u alleen documenten met OCR wilt verwerken. Intern wordt alle pagina's naar bitmaps geconverteerd en vervolgens met OCR verwerkt. Met deze methode worden alle niet-visuele en niet-standaard elementen verwijderd, zoals verborgen of bedekte objecten en tekst waarin lettertypen met niet-standaard tekencodes worden gebruikt. Dit kan een oplossing zijn wanneer het niet lukt om een standaardconversie naar doorzoekbare PDF uit te voeren.
    • Pagina's met niet-standaard codering herkennen: Selecteer deze optie als u pagina's met hun eigen lettertypen en/of codering van speciale tekens wilt verwerken.

Resultaten automatisch proeflezen na OCR

 

(Alleen toegankelijk in Power PDF.)

Selecteer deze optie als u een interactieve spellingcontrole op het verwerkte document wilt uitvoeren. Klik op Gebruikerswoordenboeken om uw eigen woordenboeken toe te voegen of te maken.

 

Automatisch zoeken naar pagina's met alleen beeld (opnieuw starten vereist)

 

(Alleen toegankelijk in Power PDF.)

Als deze optie is ingeschakeld, wordt elke PDF die u opent door Power PDF gecontroleerd. Als blijkt dat het om een document met alleen beeld gaat, wordt gevraagd of u een conversie naar een doorzoekbare PDF wilt uitvoeren. Deze controle kan erg tijdrovend zijn. Daarom is deze optie standaard uitgeschakeld.

 

Informatie op meldingenbalk weergeven

(Alleen toegankelijk in Power PDF, alleen geactiveerd als het bovengenoemde selectievakje is ingeschakeld.)

Schakel Informatie op meldingenbalk weergeven in als u wilt dat op de meldingenbalk van Power PDF, direct onder het lint, wordt aangegeven dat een bestand alleen beeld bevat. Klik op Doorzoekbaar maken om het dialoogvenster Automatische detectie weer te geven en een van de opties te selecteren die van toepassing zijn op pagina's met alleen beeld.

Schakel Informatie op meldingenbalk weergeven uit om het dialoogvenster Automatische detectie van Power PDF zonder meldingen weer te geven wanneer er pagina's met alleen beeld worden gevonden.

 

Opmerking

Van een invoerbestand dat een tekstbestand is of een bestand met een toegankelijke tekstlaag, wordt een normaal doorzoekbaar PDF-bestand gemaakt zonder OCR. In dat geval wordt geen gebruikgemaakt van de instellingen voor OCR-taal en Teken voor niet-herkend.