Fenster Erweitertes OCR-Ausgabeformat – Kommagetrennte Werte

In diesem Fenster können Sie das Ausgabeformat der kommagetrennten Wertedatei (CSV) steuern, die vom erweiterten OCR Full Text-Erkennungssystem von Kofax generiert wird. Obwohl es für beliebige Textinhalte verwendet werden kann, eignet sich dieses Format besonders zum Extrahieren von Daten aus Tabellen. Jede Zelle in einer Tabelle wird durch das Trennzeichen begrenzt. Jede Zeile in der Tabelle entspricht einer Zeile in der Ausgabedatei.

Zeilenumbrüche unterdrücken

Aktivieren Sie diese Option, um beim Speichern der erkannten Daten Zeilenumbrüche im Originaldokument zu unterdrücken (entfernen). Andernfalls werden die Zeilenumbrüche übernommen.

Seitenumbruch als Seitentrennung verwenden

Aktivieren Sie diese Option, um beim Speichern der erkannten Daten Seitenumbrüche im Originaldokument zur Trennung der Seiten zu verwenden. Andernfalls werden die Seitenumbrüche ignoriert.

Leerzeile als Absatztrennung verwenden

Aktivieren Sie diese Option, um beim Speichern der erkannten Daten Seitenumbrüche im Originaldokument zur Trennung der Seiten zu verwenden. Andernfalls werden die Seitenumbrüche ignoriert.

Nur Tabellen

Wählen Sie diese Option, wenn nur Tabellen in der Datei mit CSV-Format vorhanden sein sollen. Texte und andere Elemente des Dokuments außerhalb von Tabellen werden ignoriert.

Trennzeichen

Geben Sie ein einzelnes Zeichen an, das als Trennzeichen zwischen den erkannten Wörtern verwendet wird. Alle druckbaren Zeichen sind hierbei zulässig. Zusätzlich zu den druckbaren Zeichen, können Sie auch angeben, dass das Tabulatorzeichen als Trennzeichen für die Datei verwendet wird. Geben Sie dazu die Tabulatorsequenz (\t) ein.