Fenster Einstellungen für erweiterte OCR-Erkennung –Registerkarte Elemente

Auf dieser Registerkarte können Sie Einstellungen für erweiterte OCR-Erkennung in Elementen wie Tabellen, Bildern usw. vornehmen.

Verknüpfte Registerkarten

Textblock

Bei dieser Einstellung erfolgt die Texterkennung von links nach rechts und von oben nach unten. Wenn er ausgewählt ist, wird der erkannte Bereich als Textblock behandelt, und die anderen Einstellungen auf der Registerkarte Elemente sind nicht verfügbar und werden ignoriert.

Ein Wort pro Zeile

Mit dieser Einstellung stellen Sie die Integrität der Werte in den Indexfeldern sicher. Wenn diese Option aktiviert wird, wird der erkannte Wert wird als ein einzelnes Wort behandelt, weil Leerzeichen oder unerwünschte Zeichen während des OCR-Prozesses entfernt werden. Zum Beispiel werden Leerzeichen aus dem Wert 1 2 3 4 5 6 entfernt und das Ergebnis wäre 123456.

Tabellen erkennen

Die Einstellung, die Tabellen während des Erkennungsprozesses erkennt, wird standardmäßig ausgewählt. Wenn Dokumente keine Tabellen enthalten, wird durch das Deaktivieren der Option Tabellen erkennen die Erkennungsleistung möglicherweise gesteigert. Wenn Sie Tabellen erkennen ausschalten, sind folgende Einstellungen deaktiviert:

  • Eine Textzeile pro Zelle: Bei dieser Option wird davon ausgegangen, dass alle Zellen eine einzige Textzeile enthalten. Durch Aktivieren dieser Option kann die Leistung und/oder Genauigkeit der Erkennung verbessert werden. Wenn eine einzelne Zelle in einer Tabelle Text mit mehreren Zeilen enthält, wird jede Zeile als einzelne Zelle erkannt. In einigen Fällen ist das System nicht in der Lage, die Zellen anhand der Textzeilen zu trennen. In solchen Fällen bleibt die ursprüngliche Anordnung der Zelle erhalten.

  • Keine ausgeblendeten Trennzeichen: Bei dieser Option wird davon ausgegangen, dass in der Tabelle keine ausgeblendeten Trennzeichen vorhanden sind. Die Breite der Zellen in einer Texttabelle wird durch die Position des Trennzeichens zwischen zwei benachbarten Zellen definiert. Wenn Zellen der Tabelle verbunden sind, wird das Trennzeichen nicht entfernt, sondern ausgeblendet. Durch Aktivieren dieser Option kann die Leistung und/oder Genauigkeit der Erkennung verbessert werden.

  • Dynamischer Tabellenerkennungsmodus: Nimmt an, dass ein Dokument zahlreiche Tabellen aufweist. Verwenden Sie diese Einstellung, um sicherzustellen, dass alle Tabellen auf einer Seite erkannt werden.

Bilder erkennen

Diese Einstellung, mit der das Erkennungssystem veranlasst wird, während der Erkennung Bilder zu erkennen, ist standardmäßig ausgewählt. Wenn Dokumente keine Bilder enthalten, wird durch das Deaktivieren der Option Bilder erkennen die Erkennungsleistung möglicherweise gesteigert.

Barcodes erkennen

Diese Einstellung, mit der das Erkennungssystem veranlasst wird, während der Erkennung Barcodes zu erkennen, ist standardmäßig ausgewählt. Wenn Dokumente keine Barcodes enthalten, wird durch das Deaktivieren der Option Barcodes erkennen die Erkennungsleistung möglicherweise gesteigert.