Durchsuchbare PDF-Dateien

Enthält eine reine Bild-PDF Text oder haben Sie eine PDF-Datei aus Bilddateien erstellt, die Textelemente enthalten, können Sie diese Dokumente nicht nach ihrem Inhalt durchsuchen. Um solche Dateien durchsuchen zu können, extrahieren Sie den Text mit der optischen Zeichenerkennung, OCR. Ein durchsuchbares PDF-Dokument zeigt Seitenbilder an, enthält aber gleichzeitig eine zusätzliche Textebene, in der jedes Textzeichen dem entsprechenden Zeichen auf dem Seitenbild zugeordnet ist. Dadurch wird es möglich, die PDF zu durchsuchen. Durchsuchbare PDF-Dateien sind besonders nützlich, wenn Sie auf Inhalte in Dokumenten zugreifen möchten, die mit originalgetreuem Aussehen archiviert werden müssen.

 

Hinweis

Wenn Sie Durchsuchbare PDF ausgewählt haben, wird die OCR nur durchgeführt, wenn in der Eingabedatei keine Textebene verfügbar ist. Wird eine Textebene gefunden, wird daraus ohne Durchführung der OCR eine reguläre PDF erstellt, die durchsucht werden kann, und zwar auch, wenn Durchsuchbare PDF aktiviert ist.

 

Mit dem Create-Assistenten können Sie Nur-Bild-PDF-Dateien oder verschiedene Bilddateitypen in durchsuchbare PDF-Dokumente konvertieren.

Die Sprache für die OCR legen Sie im Dialogfeld Konvertierungseinstellungen für durchsuchbare PDFs fest.

Tipp

Eine Liste der unterstützten Dateitypen finden Sie im Hilfethema Der Create-Assistent.

 

Der Create-Assistent enthält ein vordefiniertes Profil für durchsuchbare PDFs. Sie können durchsuchbare PDF-Dateien aber auch erstellen, indem Sie in einem anderen Profil das Kontrollkästchen Durchsuchbare PDF markieren.

 

So verwenden Sie das Profil „Durchsuchbare PDF“ im Create-Assistenten:

Symbol für Optionen

  1. Wählen Sie im Create-Assistenten aus der Profilliste die Option Durchsuchbare PDF.

  2. Öffnen Sie eine oder mehrere Dateien, die Sie in durchsuchbare PDF umwandeln möchten.

  3. Klicken Sie auf die Schaltfläche Profile, um die Einstellungen im Dialogfeld PDF Create-Profile anzuzeigen. Das Kontrollkästchen Durchsuchbare PDF ist standardmäßig markiert. Behalten Sie diese Einstellung bei, und nehmen Sie ggf. Änderungen an den übrigen Optionen vor (z. B. Sicherheit, Wasserzeichen usw.).

  4. Klicken Sie auf die Schaltfläche Einstellungen, um das Dialogfeld Konvertierungseinstellungen für durchsuchbare PDFs anzuzeigen. Wählen Sie die Sprache des Quelldokuments aus und schließen Sie das Dialogfeld. Klicken Sie auf OK, um das Dialogfeld PDF Create-Profile zu schließen.

  5. Symbol für PDF-Erstellung starten
    Klicken Sie auf die Werkzeug PDF-Erstellung starten. Wenn Sie mehrere Dateien mit der Option Eine PDF-Datei für jedes Eingabedokument erstellen auswählen und die Option Dateinamen abfragen als Speicheroption festlegen, wird das Dialogfeld Speichern unter separat für jede generierte PDF-Datei angezeigt.

So erstellen Sie eine durchsuchbare PDF mit anderen Profilen:

Symbol für Optionen

  1. Wählen Sie im Create-Assistenten aus der Profilliste ein Profil aus und laden Sie die Dateien.

  2. Klicken Sie auf die Schaltfläche Profile.

  3. Markieren Sie im Dialogfeld PDF Create-Profile das Kontrollkästchen Durchsuchbar.

  4. Klicken Sie auf die Schaltfläche Einstellungen, um das Dialogfeld Konvertierungseinstellungen für durchsuchbare PDFs anzuzeigen. Wählen Sie die Sprache des Quelldokuments aus und klicken Sie auf OK.

  5. Nehmen Sie im Dialogfeld PDF Create-Profile ggf. Änderungen an den übrigen Optionen vor (z. B. Sicherheit, Wasserzeichen usw.). Klicken Sie auf OK und starten Sie die Erstellung wie oben beschrieben.

Tipp

Wenn Sie eine durchsuchbare PDF mit MRC-Komprimierung erstellen möchten, markieren Sie beide Kontrollkästchen. Wenn Sie in diesem Fall auf die Schaltfläche Einstellungen klicken, wird das Dialogfeld Konvertierungseinstellungen für durchsuchbare MRC-PDFs angezeigt.

 

 

Wenn Sie eine Nur-Bild-PDF-Datei oder eine Datei mit Nur-Bild-Seiten in Power PDF öffnen, können Sie das Programm dies automatisch erkennen lassen (unter Datei > Optionen > Dokument > Durchsuchbares PDF-Dokument). Deaktivieren Sie dazu das entsprechende Kontrollkästchen (diese Option ist standardmäßig aktiviert). Wenn die Eingabeaufforderung aktiviert ist, bietet das Programm folgende Optionen für das Dokument an:

Weitere Informationen siehe PDF-Dokumente bearbeiten.

 

Hinweis

Symbol für PDF durchsuchbar machen

In Power PDF können Sie eine Nur-Bild-PDF oder eine PDF-Datei mit reinen Bildelementen in eine durchsuchbare PDF-Datei konvertieren. Verwenden Sie dazu den Befehl PDF durchsuchbar machen unter Start > Konvertieren. Unter Datei > Optionen > Dokument > Durchsuchbare PDF-Dokumente können Sie detaillierte Optionen für die Konvertierung festlegen. Bestimmen Sie, ob die OCR nur auf Seiten mit reinen Bildelementen oder auf allen Seiten durchgeführt werden soll – im letzten Fall werden Textebenen, die bereits vor dem OCR-Vorgang in der Datei vorhanden waren, durch das Ergebnis der OCR ersetzt. Außerdem steht eine Option zur Erkennung von Dateien ohne Standardkodierung zur Verfügung. Damit werden Textebenen neu erkannt, die zwar vorhanden, aber aus Kodierungsgründen nicht verwendbar sind. Es ist möglich, den generierten Text zu prüfen, um die Genauigkeit nach dem OCR-Prozess zu erhöhen.