Fenster PDF-Bild + Text-Ausgabeformat für Text über Bild
Wenn das Erkennungsprofil auf Kofax PDF-Text unter Bild mit dem "PDF-Bild + Text"-Erkennungssystem eingestellt ist, verwenden Sie dieses Fenster für die Konfigurierung von PDF-Ausgabeeinstellungen für "Text über Bild".
Ausgabeformat
Das von dem Erkennungssystem PDF-Bild + Text generierte Ausgabeformat wird ausgewählt und in einer externen Datei gespeichert:
-
Kofax-PDF: Ein Dateiformat, in dem Sie ein Dokument auf einem beliebigen Computersystem anzeigen können, während das Layout beibehalten wird.
-
Kofax-PDF/A: Ein Dateiformat auf PDF-Basis, das die langfristige Erhaltung digitaler Dokumente unterstützt. PDF/A-Dateien sind oft größer als PDF-Dateien. Diese Option schließt auch Tags im PDF-Dokument mit ein.
Die Verfügbarkeit anderer Einstellungen in diesem Fenster kann je nach Auswahl des Ausgabeformats schwanken.
Seiteninhalt
Die Struktur der vom Erkennungssystem PDF-Bild + Text generierten Seiten:
-
Text über Bild: Der erkannte Text wird über dem gesamten Seitenbild gespeichert. Das ganze Bild wird als Bitmap gespeichert. Textbereiche werden jedoch als Text (mit Volltextsuchmöglichkeit) über der Bitmap gespeichert. Mit dieser Option können Sie beliebigen Text auswählen und kopieren.
-
Text unter Bild: Der erkannte Text wird unter dem gesamten Seitenbild gespeichert. Dies ist die Standardeinstellung. Das ganze Bild wird als Bitmap gespeichert. Der Text befindet sich jedoch darunter. Diese Option ist nützlich, wenn Sie den ihren Text in Dokumentenarchive exportieren: das vollständige Seitenlayout wird beibehalten und Volltextsuche ist verfügbar. Der darunter liegende Text kann ausgewählt und kopiert werden. Diese Option erzeugt in der Regel die größte Ausgabedatei der drei Auswahlmöglichkeiten.
-
Text und Bild: Der erkannte Text wird als Text (mit Volltextsuchmöglichkeit) gespeichert, Bilder werden als Bitmap gespeichert. Das Design des Originaldokuments (Schriftart, Hintergrund und Layout) geht verloren. Diese Option erzeugt in der Regel die kleinste Ausgabedatei der drei Auswahlmöglichkeiten.
Texteinstellungen
Wählen Sie aus, welche Textattribute beim Speichern der erkannten Daten in der Ausgabedatei beibehalten werden sollen. Aktivieren Sie beispielsweise die Option Fett, um die im Originaldokument fett formatierten Zeichen zu übernehmen.
Unsichere Wörter durch Bilder ersetzen
Vom System nicht erkannte Wörter werden durch kleine grafische Bestandteile des Worts aus der ursprünglichen Bilddatei ersetzt.
Beachten Sie, dass die Einstellungen für die Textattribute abhängig von der Einstellung Seiteninhalt unterschiedliche Ergebnisse zeigen.
- Bei Text über Bild werden die Textattribute wie ausgewählt ausgegeben. Die Originalfarbe bleibt im Ausgabetext erhalten.
-
Bei Text unter Bild wird die Auswahl der Textattribute ignoriert. Der Ausgabetext ist immer schwarzer Text auf einem weißen Hintergrund.
-
Bei Text und Bild werden die Textattribute wie ausgewählt ausgegeben. Der Ausgabetext ist immer schwarzer Text auf einem weißen Hintergrund.
Textfarbe erhalten
Aktivieren Sie diese Option, um beim Speichern der erkannten Daten die Textfarbe im Originaldokument zu übernehmen. Andernfalls wird die Farbe im Original ignoriert.
Erkannte Schriftarten einbetten
Erkannte Schriftarten werden in die PDF-Datei eingebettet. Durch das Einbetten von Schriftarten wird sichergestellt, dass in der PDF-Datei die gleichen Schriftarten wie im ursprünglichen Dokument verwendet werden, gleichgültig, wo Sie die PDF-Datei öffnen oder was für Schriftarten auf dem System installiert sind.
Auflösung
Die Auflösung der Bilder für ein PDF-Dokument, das als Ausgabedatei gespeichert wird. Sie können eine der folgenden Ausgabeauflösungen in DPI auswählen:
-
72
-
96
-
120
- 200
-
240
-
300
-
360
-
400
-
600
Komprimierungsformat
Wählen Sie aus der Liste ein Komprimierungsformat (CCITT4, JPEG oder JPEG 2000) für die PDF-Ausgabe.
Standardmäßig ist JPEG ausgewählt, das für Farb- und Graustufenbilder unterstützt wird. Wenn Sie zweifarbige Bilder verarbeiten, wenn JPEG ausgewählt ist, wird stattdessen CCITT4 verwendet.
JPEG-Qualität
Hiermit können Sie die JPEG-Qualität für Farbbilder angeben, die in der Ausgabedatei gespeichert werden. Die Qualität reicht von 1% bis 100%, wobei 100% die beste Qualität darstellt.
PDF-Version
Wählen Sie eine der folgenden PDF-Versionen für die Ausgabe:
-
Autom.
-
1.3
-
1.4
-
1.5
-
1.6
-
1.7
Wenn Sie Auto auswählen, bestimmt die Anwendung die PDF-Versionsnummer automatisch.
PDF/A-Compliance
Wenn Kofax-PDF/A als Ausgabeformat gewählt wurde, wählen Sie die Stufe für PDF/A-Compliance:
-
PDF/A-1a: (Standard): Unterstützt die langfristige Speicherung digitaler Dokumente und erfüllt vollständig die Anforderungen in der ISO 19005-1-Spezifikation. Lesbar für jeden PDF-Reader, der Version PDF 1.4 oder höher
-
PDF/A-1b: Bietet die gleiche Compliance-Stufe wie PDF/A-1a und erfüllt die Minimalanforderungen in der ISO 19005-1-Spezifikation.
-
PDF/A-2a: Bietet die gleiche Compliance-Stufe wie PDF/A-1a und ergänzt die Unterstützung von JPEG 2000-Komprimierung zur Reduzierung der Dateigröße. Erfüllt die Anforderungen in der ISO 19005-2-Spezifikation. Lesbar für jeden PDF-Reader, der Version PDF 1.7
-
PDF/A-2u: Bietet die gleiche Compliance-Stufe wie PDF/A-2a und ergänzt die Fähigkeit, Text in Unicode zu extrahieren.
-
PDF/A-3a: Erlaubt die Einbettung einer anderen PDF/A-Datei oder eines binären Dateiformats (wie XML oder Microsoft Office) in die PDF/A-Datei. Erfüllt die Anforderungen in der ISO 19005-3-Spezifikation. Ansonsten identisch mit PDF/A-2a
Hinweis Bei der PDF/A-3a-Compliance sollte nur die PDF/A-Datei für Archivierungszwecke in Betracht gezogen werden, nicht die eingebettete Datei. -
PDF/A-3u: Bietet die gleiche Compliance-Stufe wie PDF/A-3a und ergänzt die Fähigkeit, Text in Unicode zu extrahieren.
Tags zum Dokument hinzufügen
PDF-Tags werden zum PDF-Dokument hinzugefügt, die die Dokumentenstruktur festlegen und das Extrahieren von Seiteninhalt ermöglichen. Markierungen sind nützlich für rückfließenden Text und Grafiken, die Konvertierung in HTML- und XML-Dateiformate und die Interpretation durch Software für Sehbehinderte.
Bildkomprimierung
Wählen Sie ein Bildkomprimierungsprofil aus der Liste aus.
Schaltfläche Bearbeiten
Ändern eines vorhandenen Bildkomprimierungsprofils oder Erstellen eines neuen. Das Fenster Bildkomprimierungsprofile wird geöffnet, in dem Sie den zu verwendenden Bildkomprimierungstyp angeben können.