PDF-Dateien durchsuchbar machen
Enthält eine reine Bild-PDF Text oder haben Sie eine PDF-Datei aus Bilddateien erstellt, die Textelemente enthalten, können Sie diese Dokumente nicht nach ihrem Inhalt durchsuchen. Um diese Dateien durchsuchbar zu machen , sollte OCR verwendet werden, um ihren Text zu extrahieren. Ein durchsuchbares PDF-Dokument zeigt Seitenbilder an, enthält aber gleichzeitig eine zusätzliche Textebene, in der jedes Textzeichen dem entsprechenden Zeichen auf dem Seitenbild zugeordnet ist. Dadurch wird es möglich, die PDF zu durchsuchen. Durchsuchbare PDF-Dateien sind besonders nützlich, wenn Sie auf Inhalte in Dokumenten zugreifen möchten, die mit originalgetreuem Aussehen archiviert werden müssen.
Wenn Sie Durchsuchbare PDF ausgewählt haben, wird die OCR nur durchgeführt, wenn in der Eingabedatei keine Textebene verfügbar ist. Wird eine Textebene gefunden, wird daraus ohne Durchführung der OCR eine reguläre PDF erstellt, die durchsucht werden kann, und zwar auch, wenn Durchsuchbare PDF aktiviert ist.
Mit dem Create-Assistenten können Sie Nur-Bild-PDF-Dateien oder verschiedene Bilddateitypen in durchsuchbare PDF-Dokumente konvertieren.
Die Sprache für die OCR legen Sie im Dialogfeld Konvertierungseinstellungen für durchsuchbare PDFs fest.
Der Create-Assistent enthält ein vordefiniertes separates Profil namens „Durchsuchbare PDF“. Sie können durchsuchbare PDF-Dateien aber auch erstellen, indem Sie in einem anderen Profil das Kontrollkästchen Durchsuchbare PDF markieren.
Verwenden des Profils „Durchsuchbare PDF“ im Create-Assistenten
- Wählen Sie in der Profilliste des Create-Assistenten die Option Durchsuchbare PDF.
- Öffnen Sie eine oder mehrere Dateien, die Sie in durchsuchbare PDF umwandeln möchten.
- Klicken Sie auf Profile, und prüfen Sie die Einstellungen im Dialogfeld PDF Create-Profile. Das Kontrollkästchen Durchsuchbare PDF ist standardmäßig aktiviert. Behalten Sie diese Einstellung bei, und nehmen Sie ggf. Änderungen an den übrigen Einstellungen vor (z. B. Sicherheit, Wasserzeichen usw.).
-
Klicken Sie auf die Schaltfläche Einstellungen, um das Dialogfeld Konvertierungseinstellungen für durchsuchbare PDFs anzuzeigen.
- Wählen Sie die Sprache des Quelldokuments in der Liste OCR-Sprache aus.
- Ändern Sie andere Einstellungen, falls erforderlich, und klicken Sie dann auf OK, um das Dialogfeld zu schließen.
- Klicken Sie auf OK, um das Dialogfeld PDF Create-Profile zu schließen.
-
Klicken Sie auf das Werkzeug PDF-Erstellung starten.
Die Datei wird gemäß den aktuellen Zieleinstellungen gespeichert. Die Ergebnis-PDFs werden entweder im Quellordner oder in einem zuvor definierten Ordner gespeichert, oder das Dialogfeld Speichern unter angezeigt.
Ein Informationsdialogfeld liefert Statusinformationen zum Erstellungsprozess sowie eine Liste der Ergebnis-PDF-Dateien mit Dateinamen, Pfad, Dateityp und Erstellungsdatum.
- Im PDF Create Auftragsinformationen-Dialogfeld von „PDF erstellen“ werden Statusinformationen zum Erstellungsprozess sowie eine Liste der erstellten PDF-Dateien mit Dateinamen, Pfad, Dateityp und Erstellungsdatum angezeigt. Klicken Sie auf Schließen, um zum „Create PDF“-Fenster zurückzukehren und es zu schließen. Klicken Sie auf Schließen, um zum Fenster „Create PDF“ zurückzukehren und es zu schließen.
Erstellen von durchsuchbaren PDF mit anderen Profilen im Create-Assistenten
- Wählen Sie in der Profilliste des Create-Assistenten ein Profil aus und laden Sie Dateien.
- Klicken Sie auf Profile.
-
Aktivieren Sie im Dialogfeld PDF Create-Profile das Kontrollkästchen Durchsuchbar.
Wenn Sie eine durchsuchbare PDF mit MRC-Komprimierung erstellen möchten, markieren Sie beide Kontrollkästchen. Wenn Sie in diesem Fall auf die Schaltfläche Einstellungen klicken, wird das Dialogfeld Konvertierungseinstellungen für durchsuchbare MRC-PDFs angezeigt.
- Klicken Sie auf die Schaltfläche Einstellungen, um das Dialogfeld Konvertierungseinstellungen für durchsuchbare PDFs anzuzeigen. Wählen Sie die Sprache des Quelldokuments aus, und klicken Sie auf OK.
- Falls erforderlich, nehmen Sie im Dialogfeld PDF Create-Profile Änderungen an anderen Einstellungen vor (z. B. Sicherheit, Wasserzeichen usw.).
- Klicken Sie auf OK, um das Dialogfeld PDF Create-Profile zu schließen.
-
Klicken Sie auf das Werkzeug PDF-Erstellung starten.
Die Datei wird gemäß den aktuellen Zieleinstellungen gespeichert. Die Ergebnis-PDFs werden entweder im Quellordner oder in einem zuvor definierten Ordner gespeichert, oder das Dialogfeld Speichern unter angezeigt.
- Ein Informationsdialogfeld liefert Statusinformationen zum Erstellungsprozess sowie eine Liste der Ergebnis-PDF-Dateien mit Dateinamen, Pfad, Dateityp und Erstellungsdatum. Klicken Sie auf Schließen, um zum Fenster „Create PDF“ zurückzukehren und es zu schließen.
Umwandlung einer PDF mit Nur-Bild-Teilen in eine durchsuchbare Power PDF
Um in Power PDF ein Nur-Bild-PDF oder eine PDF mit Nur-Bild-Teilen in eine durchsuchbare PDF umzuwandeln, führen Sie die folgenden Schritte aus.
-
Klicken Sie auf der Registerkarte Start der Multifunktionsleiste auf PDF durchsuchbar machen.
- Bestimmen Sie im Dialogfeld Seiten konvertieren, ob OCR nur auf Seiten mit reinen Bildelementen oder auf allen Seiten durchgeführt werden soll – im letzten Fall werden Textebenen, die bereits vor dem OCR-Vorgang in der Datei vorhanden waren, durch das Ergebnis der OCR ersetzt.
-
Klicken Sie auf Einstellungen, um das Dialogfeld Konvertierungseinstellungen für durchsuchbare PDFs anzuzeigen. Aktualisieren Sie, falls erforderlich, die wichtigsten Einstellungen, klicken Sie dann auf OK, um die Änderungen zu speichern und zurückzukehren.
Weitere Informationen zu Einstellungen finden Sie in PDF-Dokumente bearbeiten.
- Wählen Sie die Sprache des Quelldokuments in der Liste OCR-Sprache aus.
- Wählen Sie Dokumente mittels OCR verarbeiten, um OCR auszuführen, wenn eine Textebene ohne Standardkodierung erkannt wird, die zwar vorhanden, aber aus Kodierungsgründen nicht verwendbar ist.
- Wählen Sie Ergebnisse nach OCR automatisch überprüfen, um generierten Text auf Genauigkeit des OCR-Prozesses zu prüfen.
- Klicken Sie auf OK, um die Umwandlung durchzuführen.