Fenster PDF-Bild + Text-Ausgabeformat für Text über Bild

Wenn das Erkennungsprofil auf Kofax PDF-Text unter Bild mit dem "PDF-Bild + Text"-Erkennungssystem eingestellt ist, verwenden Sie dieses Fenster für die Konfigurierung von PDF-Ausgabeeinstellungen für "Text über Bild".

Ausgabeformat

Das von dem Erkennungssystem PDF-Bild + Text generierte Ausgabeformat wird ausgewählt und in einer externen Datei gespeichert:

  • Kofax-PDF: Ein Dateiformat, in dem Sie ein Dokument auf einem beliebigen Computersystem anzeigen können, während das Layout beibehalten wird.

  • Kofax-PDF/A: Ein Dateiformat auf PDF-Basis, das die langfristige Erhaltung digitaler Dokumente unterstützt. PDF/A-Dateien sind oft größer als PDF-Dateien. Diese Option schließt auch Tags im PDF-Dokument mit ein.

Die Verfügbarkeit anderer Einstellungen in diesem Fenster kann je nach Auswahl des Ausgabeformats schwanken.

Seiteninhalt

Die Struktur der vom Erkennungssystem PDF-Bild + Text generierten Seiten:

  • Text über Bild: Der erkannte Text wird über dem gesamten Seitenbild gespeichert. Das ganze Bild wird als Bitmap gespeichert. Textbereiche werden jedoch als Text (mit Volltextsuchmöglichkeit) über der Bitmap gespeichert. Mit dieser Option können Sie beliebigen Text auswählen und kopieren.

  • Text unter Bild: Der erkannte Text wird unter dem gesamten Seitenbild gespeichert. Dies ist die Standardeinstellung. Das ganze Bild wird als Bitmap gespeichert. Der Text befindet sich jedoch darunter. Diese Option ist nützlich, wenn Sie den ihren Text in Dokumentenarchive exportieren: das vollständige Seitenlayout wird beibehalten und Volltextsuche ist verfügbar. Der darunter liegende Text kann ausgewählt und kopiert werden. Diese Option erzeugt in der Regel die größte Ausgabedatei der drei Auswahlmöglichkeiten.

  • Text und Bild: Der erkannte Text wird als Text (mit Volltextsuchmöglichkeit) gespeichert, Bilder werden als Bitmap gespeichert. Das Design des Originaldokuments (Schriftart, Hintergrund und Layout) geht verloren. Diese Option erzeugt in der Regel die kleinste Ausgabedatei der drei Auswahlmöglichkeiten.

Texteinstellungen

Wählen Sie aus, welche Textattribute beim Speichern der erkannten Daten in der Ausgabedatei beibehalten werden sollen. Aktivieren Sie beispielsweise die Option Fett, um die im Originaldokument fett formatierten Zeichen zu übernehmen.

Unsichere Wörter durch Bilder ersetzen

Vom System nicht erkannte Wörter werden durch kleine grafische Bestandteile des Worts aus der ursprünglichen Bilddatei ersetzt.

Hinweis Abhängig vom Bild ist das Erkennungssystem PDF-Bild + Text bisweilen nicht in der Lage, die Textattribute Fett oder Kursiv zu erkennen, auch wenn diese Optionen im Dialogfeld ausgewählt wurden.

Beachten Sie, dass die Einstellungen für die Textattribute abhängig von der Einstellung Seiteninhalt unterschiedliche Ergebnisse zeigen.

  • Bei Text über Bild werden die Textattribute wie ausgewählt ausgegeben. Die Originalfarbe bleibt im Ausgabetext erhalten.
  • Bei Text unter Bild wird die Auswahl der Textattribute ignoriert. Der Ausgabetext ist immer schwarzer Text auf einem weißen Hintergrund.

  • Bei Text und Bild werden die Textattribute wie ausgewählt ausgegeben. Der Ausgabetext ist immer schwarzer Text auf einem weißen Hintergrund.

Textfarbe erhalten

Aktivieren Sie diese Option, um beim Speichern der erkannten Daten die Textfarbe im Originaldokument zu übernehmen. Andernfalls wird die Farbe im Original ignoriert.

Erkannte Schriftarten einbetten

Erkannte Schriftarten werden in die PDF-Datei eingebettet. Durch das Einbetten von Schriftarten wird sichergestellt, dass in der PDF-Datei die gleichen Schriftarten wie im ursprünglichen Dokument verwendet werden, gleichgültig, wo Sie die PDF-Datei öffnen oder was für Schriftarten auf dem System installiert sind.

Auflösung

Die Auflösung der Bilder für ein PDF-Dokument, das als Ausgabedatei gespeichert wird. Sie können eine der folgenden Ausgabeauflösungen in DPI auswählen:

  • 72

  • 96

  • 120

  • 200
  • 240

  • 300

  • 360

  • 400

  • 600

Hinweis Bei Bedarf kann die Bildqualität durch Erhöhen der Standardauflösung (72 dpi) verbessert werden. Die maximale Einstellung entspricht dem Wert der Auflösung des Originalbilds. Wenn z. B. die ursprüngliche Bildauflösung einer gescannten Seite 200 dpi ist und die Auflösung auf 300 dpi gesetzt wird, ist die Bildauflösung der Ausgabedatei 200 dpi statt 300 dpi.

Komprimierungsformat

Wählen Sie aus der Liste ein Komprimierungsformat (CCITT4, JPEG oder JPEG 2000) für die PDF-Ausgabe.

Standardmäßig ist JPEG ausgewählt, das für Farb- und Graustufenbilder unterstützt wird. Wenn Sie zweifarbige Bilder verarbeiten, wenn JPEG ausgewählt ist, wird stattdessen CCITT4 verwendet.

Hinweis Wenn Sie PDF/A auswählen, wird das JPEG 2000-Format nicht unterstützt.

JPEG-Qualität

Hiermit können Sie die JPEG-Qualität für Farbbilder angeben, die in der Ausgabedatei gespeichert werden. Die Qualität reicht von 1% bis 100%, wobei 100% die beste Qualität darstellt.

PDF-Version

Wählen Sie eine der folgenden PDF-Versionen für die Ausgabe:

  • Autom.

  • 1.3

  • 1.4

  • 1.5

  • 1.6

  • 1.7

Wenn Sie Auto auswählen, bestimmt die Anwendung die PDF-Versionsnummer automatisch.

PDF/A-Compliance

Wenn Kofax-PDF/A als Ausgabeformat gewählt wurde, wählen Sie die Stufe für PDF/A-Compliance:

  • PDF/A-1a: (Standard): Unterstützt die langfristige Speicherung digitaler Dokumente und erfüllt vollständig die Anforderungen in der ISO 19005-1-Spezifikation. Lesbar für jeden PDF-Reader, der Version PDF 1.4 oder höher

  • PDF/A-1b: Bietet die gleiche Compliance-Stufe wie PDF/A-1a und erfüllt die Minimalanforderungen in der ISO 19005-1-Spezifikation.

  • PDF/A-2a: Bietet die gleiche Compliance-Stufe wie PDF/A-1a und ergänzt die Unterstützung von JPEG 2000-Komprimierung zur Reduzierung der Dateigröße. Erfüllt die Anforderungen in der ISO 19005-2-Spezifikation. Lesbar für jeden PDF-Reader, der Version PDF 1.7

  • PDF/A-2u: Bietet die gleiche Compliance-Stufe wie PDF/A-2a und ergänzt die Fähigkeit, Text in Unicode zu extrahieren.

  • PDF/A-3a: Erlaubt die Einbettung einer anderen PDF/A-Datei oder eines binären Dateiformats (wie XML oder Microsoft Office) in die PDF/A-Datei. Erfüllt die Anforderungen in der ISO 19005-3-Spezifikation. Ansonsten identisch mit PDF/A-2a

    Hinweis Bei der PDF/A-3a-Compliance sollte nur die PDF/A-Datei für Archivierungszwecke in Betracht gezogen werden, nicht die eingebettete Datei.
  • PDF/A-3u: Bietet die gleiche Compliance-Stufe wie PDF/A-3a und ergänzt die Fähigkeit, Text in Unicode zu extrahieren.

Tags zum Dokument hinzufügen

PDF-Tags werden zum PDF-Dokument hinzugefügt, die die Dokumentenstruktur festlegen und das Extrahieren von Seiteninhalt ermöglichen. Markierungen sind nützlich für rückfließenden Text und Grafiken, die Konvertierung in HTML- und XML-Dateiformate und die Interpretation durch Software für Sehbehinderte.

Bildkomprimierung

Wählen Sie ein Bildkomprimierungsprofil aus der Liste aus.

Schaltfläche Bearbeiten

Ändern eines vorhandenen Bildkomprimierungsprofils oder Erstellen eines neuen. Das Fenster Bildkomprimierungsprofile wird geöffnet, in dem Sie den zu verwendenden Bildkomprimierungstyp angeben können.