Fenster Erweitertes OCR-Ausgabeformat – Kommagetrennte Werte
In diesem Fenster können Sie das Ausgabeformat der Datei mit kommagetrennten Werten (CSV) steuern, die vom erweiterten OCR Full Text-Erkennungssystem von Kofax generiert wird. Obwohl es für beliebige Textinhalte verwendet werden kann, eignet sich dieses Format besonders zum Extrahieren von Daten aus Tabellen. Jede Zelle in einer Tabelle wird durch das Trennzeichen begrenzt. Jede Zeile in der Tabelle entspricht einer Zeile in der Ausgabedatei. Es gelten die folgenden Regeln:
- Die erkannten Zeilen werden in der endgültigen Ausgabe in separate Zeilen gegliedert.
- Die erkannten Absätze werden ohne Leerzeilen als Trennzeichen in der endgültigen Ausgabe aufgereiht.
- Erkannte Texte und Tabellen werden immer in die letzte Ausgabe exportiert.
Betriebssystemtrennzeichen verwenden
Betriebssystemtrennzeichen verwenden ist der Standardwert für das Profil. Das Trennzeichen wird den Einstellungen des Betriebssystems entsprechend erkannt.
Benutzerdefiniertes Trennzeichen verwenden
Wenn Sie diese Option auswählen, wird das editierbare Feld Trennzeichen aktiviert. Geben Sie ein einzelnes Zeichen an, das als Trennzeichen zwischen den erkannten Wörtern verwendet wird. Alle druckbaren Zeichen sind hierbei zulässig. Zusätzlich zu den druckbaren Zeichen, können Sie auch angeben, dass das Tabulatorzeichen als Trennzeichen für die Datei verwendet werden kann. Geben Sie dazu die Tabulatorsequenz (\t) ein.