OCR (Optische Zeichen Erkennung)

Verwendung von OCR in Kofax Power PDF for Mac

OCR (Optical Character Recognition = Optische Zeichen Erkennung) ist der Prozess der Konvertierung eines Bitmap-Bildes von Text (z.B. eines gescannten Dokuments) in Text, der von Kofax Power PDF for Mac und anderer Textbearbeitungssoftware ausgewählt, kopiert und durchsucht werden kann. Sobald der Text von der OCR erkannt wurde, wird er auf einer unsichtbaren Ebene über dem sichtbaren Bild des Textes platziert. Wenn Sie Text kopieren, wird der Text von dieser unsichtbaren OCR-Ebene kopiert. Die OCR-Technologie erzeugt keine perfekte Wiedergabe des Bitmap-Textes. Sie müssen den Text, der durch OCR erzeugt wurde, Korrektur lesen und bearbeiten.

Automatischer OCR-Durchlauf

  1. Öffnen Sie ein gescanntes PDF in Kofax Power PDF for Mac.
  2. Es öffnet sich ein Warnfenster mit der Meldung:
    "Dieses Dokument scheint gescannt zu sein. Wollen Sie eine optische Texterkennung (OCR) darauf ausführen? Nach der OCR können Sie dann Text auswählen."
  3. Sie haben nun drei Möglichkeiten:
  • Abbrechen: Es wird kein OCR-Durchlauf durchgeführt.
  • OCR der Seite: Der OCR-Durchlauf wird auf der aktuellen Seite durchgeführt.
  • OCR des Dokuments: Wenn Ihr Dokument mehrere Seiten hat, wird der OCR-Durchlauf auf allen Seiten durchgeführt.

Wählen Sie in den Einstellungen > OCR, welche Sprachen von OCR erkannt werden. (Einstellungen).

Während Kofax Power PDF for Mac den OCR-Durchlauf durchführt, wird ein Fortschrittsbalken angezeigt. Der Vorgang kann je nach Größe und Inhalt des gescannten Dokuments nur wenige Sekunden oder auch wesentlich länger dauern.

Manueller OCR-Durchlauf

Um einen OCR-Durchlauf manuell auszuführen, wählen Sie Bearbeiten > OCR-Seite. Kofax Power PDF for Mac beginnt mit der Durchführung des OCR-Durchlaufs und der Fortschrittsbalken wird angezeigt.

OCR erzwingen

Kofax Power PDF for Mac wenn das Dokument ein Bild in der Größe einer Seite enthält, geht die Anwendung davon aus, dass es sich um einen Scan handelt und bietet automatisch an, einen OCR-Durchlauf durchzuführen. In einigen Fällen erkennt Kofax Power PDF for Mac ein gescanntes Dokument möglicherweise nicht. Im Menü "Bearbeiten" ist dann die Option "OCR-Seite" ausgegraut und kann nicht ausgewählt werden.

  1. Halten Sie die Cmd- und die Alt-Taste gleichzeitig gedrückt.
  2. Wählen Sie im Menü Bearbeiten > OCR-Seite.

OCR - Stapelverarbeitung

(Erweiterte Funktion von Kofax Power PDF for Mac). Siehe OCR - Stapelverarbeitung.

Tipps zum Verbessern der OCR-Ergebnisse

  • Die Qualität des Originaldokuments beeinflusst die Qualität der OCR-Leistung. Scharfe und klare Originalbilder vom Text führen zu wesentlich besseren Ergebnissen als zerknitterte, verblasste Fotokopien.
  • Legen Sie Ihr Originaldokument so gerade wie möglich auf den Scanner. Wenn Sie eine gescannte Seite haben, die nicht gerade ist, können Sie das Bild in Kofax Power PDF for Mac "neigen" oder begradigen, indem Sie Bearbeiten > Bild entzerren und ausrichten... wählen.
  • Erhöhen Sie den Kontrast des gescannten Dokuments, damit der Hintergrund so weiß als möglich ist. Sie können den Kontrast des Bildes einstellen, indem Sie Bearbeiten > Bild entzerren und ausrichten wählen...

Wörterbücher und OCR

Medizinische und juristische Wörterbücher sind in der OCR-Routine von Kofax Power PDF for Macenthalten, um die Qualität der OCR-Ausgabe für gescannte Dokumente durch die Erkennung von Wörtern zu verbessern, die für medizinische und juristische Berufe spezifisch sind. Diese Funktion ist integriert, so dass Sie keine Einstellungen vornehmen müssen. Wenn Sie sich für die Bearbeitung von OCR-Text entscheiden, werden falsch geschriebene Wörter für den ausgewählten Text möglicherweise rot unterkringelt angezeigt.