Konvertierungseinstellungen für durchsuchbare PDFs

Dieses Dialogfeld wird angezeigt, wenn Sie:

  • im Dialogfeld PDF Create-Profile auf die Schaltfläche Einstellungen klicken, wenn das Kontrollkästchen Durchsuchbar markiert ist.
  • auf Konvertieren > Andere > Durchsuchbares PDF, und dann im Dialogfeld Seiten konvertieren auf Einstellungen klicken.
  • unter Datei > Optionen > Dokument > Durchsuchbares PDF-Dokument die Optionen für den OCR-Prozess aufrufen.

Verwenden Sie diese Einstellungen, wenn Sie aus Bilddateien oder Nur-Bild-PDF-Dateien, die nicht durchsuchbar sind, durchsuchbare PDFs erstellen möchten. Eine Liste der unterstützten Dateitypen finden Sie im Hilfethema Der Create-Assistent.

OCR-Sprache
OCR ist erforderlich, um Text aus Bilddateien zu extrahieren, sodass die Datei durchsucht werden kann. Wählen Sie die Sprache, in der Ihr Dokument abgefasst ist.
Auslassungszeichen
Nicht erkennbare Zeichen werden durch ein Auslassungszeichen dargestellt, (standardmäßig eine Tilde ~). Wenn die OCR beispielsweise das Zeichen „G“ in „FRAGLICH“ nicht erkennt und ~ als Auslassungszeichen verwendet wird, wird im Dokument „FRA~LICH“ angezeigt.
Geben Sie im Feld Auslassungszeichen das Zeichen ein, das als Auslassungszeichen verwendet werden soll. Dabei sollten Sie ein Zeichen wählen, das normalerweise nicht in den Dokumenten enthalten ist.
Originalbilder beibehalten
Markieren Sie dieses Kontrollkästchen, wenn Sie das Originalbild nach der Konvertierung beibehalten möchten.
Seiten automatisch ausrichten
Aktivieren Sie dieses Kontrollkästchen, um die Seitenausrichtung automatisch festzulegen (Querformat oder Hochformat).
Zu verarbeitende Seiten
Wählen Sie aus, welche Seiten verarbeitet werden sollen, wenn das PDF-Dokument in ein durchsuchbares Dokument konvertiert wird.
  • Nur-Bild-Seiten: Standardmäßig verarbeitet Power PDF nur Seiten, die Nur-Bild-Inhalte (Bitmap) enthalten, ohne eine Textebene.
  • Alle Seiten: Wählen Sie diese Option, um Seiten unabhängig von bestehenden Komponenten zu verarbeiten.
    • Dokumente mittels OCR verarbeiten: Wählen Sie diese Option, wenn Sie Dokumente nur mittels OCR verarbeiten möchten. Intern werden alle Seiten ins Bitmap-Format konvertiert und dann durch OCR verarbeitet. Bei dieser Methode werden alle nicht visuellen und nicht standardmäßigen Elemente (z. B. verborgene oder verdeckte Objekte, Texte in Schriftarten mit nicht standardmäßigen Zeichencodes) übersprungen. Diese Vorgehensweise kann nützlich sein, wenn die Standardkonvertierung in durchsuchbares PDF fehlschlägt.
    • Erkennung von Seiten ohne Standardkodierung: Wählen Sie diese Option, um Seiten mit eigenen Schriftarten und/oder Sonderzeichenkodierung zu verarbeiten.
Ergebnisse nach OCR automatisch überprüfen
(Nur in Power PDF verfügbar) Wählen Sie diese Option, um eine interaktive Rechtschreibprüfung im verarbeiteten Dokument durchzuführen. Klicken Sie auf Benutzerwörterbücher, um ein eigenes Vokabular hinzuzufügen oder zu erstellen.
Automatisch nach Nur-Bild-Seiten suchen (Neustart erforderlich)
(Nur in Power PDF verfügbar) Falls diese Option aktiviert wird, prüft Power PDF jede PDF beim Öffnen, und falls das Dokument Nur-Bild-Seiten enthält, wird die Konvertierung in eine durchsuchbare PDF angeboten. Der Prüfvorgang kann sehr zeitaufwändig sein, deshalb ist diese Option standardmäßig deaktiviert.
In Benachrichtigungsleiste anzeigen
(Nur in Power PDF verfügbar und nur aktiviert, falls das vorhergehende Kontrollkästchen ausgewählt ist.) Wählen Sie die Option „In Benachrichtigungsleiste anzeigen“, um von Power PDF Informationen über Nur-Bild-Seiten zu erhalten. Diese werden unterhalb der Multifunktionsleiste in der Benachrichtigungsleiste angezeigt. Klicken Sie auf Durchsuchbar machen, um das Dialogfeld Automatische Erkennung anzuzeigen. Wählen Sie die auf die Nur-Bild-Seiten anzuwenden OCR-Einstellungen aus.
Deaktivieren Sie die Option „In Benachrichtigungsleiste anzeigen“, wenn Power PDF das Dialogfeld „Automatische Erkennung“ ohne Benachrichtigung anzeigen soll, sobald Nur-Bild-Seiten erkannt werden.

Bei der Konvertierung von Textdateien oder Dateien mit verfügbaren Textebenen wird eine reguläre durchsuchbare PDF ohne Einsatz der OCR erstellt. Die Einstellungen für die OCR-Sprache und das Auslassungszeichen werden in diesem Fall nicht verwendet.