Der Dialog OCR Mapping
Im Mappingdialog können Sie die
Dokumentklassifikation und -extraktion einstellen. Außerdem nehmen
Sie hier die Zuordnung von Leseergebnissen zu XBOUND-Feldern vor.
|
Auf der linken Seite der
Liste sehen Sie alle in ABBYY / RecoStar definierten
Dokumentvorlagen und deren Felder. Auf der rechten Seite wird
die Zuordnung der Vorlagen und Felder zu XBOUND-Dokumenttypen
und -Feldern angezeigt. Klicken Sie auf eine Zeile, um die XBOUND Zuordnung zu ändern.
Der Dialog wird angezeigt,
in dem Sie das/die zuzuordnenden XBOUND Objekte auswählen, ein
neues XBOUND Objekt hinzufügen oder die XBOUND Zuordnung aufheben
können. Neu in XBOUND anzulegende Objekte werden blau kursiv dargestellt.
Beim Schließen des Mappingdialogs werden diese in XBOUND erstellt. Weitere
Informationen zum Mapping der Aktivität RecoStar Professional
Extraction:
RecoStar-Operatoren vom Typ BoxReadField werden
unterstützt. Dieser Operator sucht nach einem (eventuell
unterteilten) Feld innerhalb einer bestimmten geometrischen
Zone und liest den Inhalt. Das Ergebnis wird im XBOUND
als OCRResult und
als Wert des zum BoxReadField zugeordneten Feldes gespeichert. Auch der PixelCountField-Operator wird unterstützt.
Dieser zählt die schwarzen Pixel in der durch Zone definierte
Region. Hinweise Der Wert des zum PixelCountField zugeordneten
Feldes wird X, wenn der Wert zwischen PixelMinRatio
und PixelMaxRatio liegt, sonst O (der Buchstabe "O"). Confidence Rank wird am FieldValue gespeichert.
Er ist "OK" wenn PixelCountField.IsInRange
= true, sonst "Reject". Für jedes PixelCountField-Ergebnis wird ein
im EngineResult mit folgender Eigenschaftenzuordnung
angelegt: OMRResult.Blackness = PixelCount.Percentage OMRResult.Checked = PixelCount.IsInRange OMRResult.Confidence = 1 falls PixelCount.IsInRange
= true, sonst 0.
|
|
| :Markieren Sie diese
Option, wenn ABBYY / RecoStar
nicht klassifizieren soll. ABBYY / RecoStar
verwendet die Dokumentvorlage zum Auslesen, welche
dem aktuellen Dokumenttyp zugeordnet ist. ( Ablauf
bei der Verwendung dieser Option mit ABBYY FlexiCapture Extraction.)
XBOUND übergibt alle Medien eines Dokuments
als ein Stapel an ABBYY. Ist die Option aktiviert, dann wird ermittelt,
wie viele Seiten anhand der, dem aktuellen XBOUND
Dokumenttyp zugeordneten, Dokumentdefinition erwartet
werden (Anzahl der Seiten aller Dokumentsektionen).
Stimmt die Anzahl überein, dann wird das
Dokument an ABBYY zur Bearbeitung übergeben In allen anderen Fällen wird eine Fehlermeldung
ausgegeben: "Die Anzahl der Seiten im Dokumententemplate
[99] stimmt nicht mit der Anzahl der Seiten am
Dokument [99] überein."
Bearbeitung des Stapels (das aktuellen Dokuments)
durch ABBYY. Übernahme des Klassifikationsergebnisses als Dokumenttyp, sofern nicht
die Option
ausgewählt wurde. Es wird der, der Dokumentdefinition im OCR Mapping zugeordnete,
XBOUND Dokumenttyp gesetzt. Alle Dokumentsektionen werden durchlaufen. In
ihnen werden die Feldbereiche und deren Felder durchlaufen
und die Werte der Felder/Tabellen in XBOUND übernommen.
Welches ABBYY Feld in welches XBOUND Feld übernommen
wird, wird im OCR Mapping definiert. Alle Feld-/Tabellenzellenwerte werden wie folgt
in XBOUND übernommen. Jedem Feld wird seine Position
auf dem Image mitgegeben. Bei Textfeldern werden zusätzlich
die gelesenen Zeichen und ihre Konfidenz übernommen
Feldtyp
| Übernommener
Wert | FT_Checkmark | AsBoolean | FT_CheckmarkGroup | AsString | FT_CurrencyField | AsString | FT_DateTimeField | AsDateTime als LongDateString | FT_Document | Nicht implementiert (keine Übernahme
in ein XBOUND Feld) | FT_Group | Nicht implementiert (keine Übernahme
in ein XBOUND Feld) | FT_NumberField | AsDouble | FT_PageGroup | Nicht implementiert (keine Übernahme
in ein XBOUND Feld) | FT_PictureField | Nicht implementiert (keine Übernahme
in ein XBOUND Feld) | FT_TextField | AsString |
Felder werden als 0 oder 1 Werte in XBOUND abgebildet.
:
Markieren Sie diese Option, wenn ABBYY / RecoStar
das Dokument klassifizieren und auslesen soll. Zur
Übernahme des Klassikationsergebnisses bei mehrseitigen Formularen
siehe die Beschreibung der Option in der Aktivität
RecoStar Professional Extraction. ( Ablauf
bei der Verwendung dieser Option mit ABBYY FlexiCapture Extraction.) XBOUND übergibt alle Medien eines Dokuments
als ein Stapel an ABBYY. Bearbeitung des Stapels (das aktuellen Dokuments)
durch ABBYY inklusive Klassifikation. Übernahme des Klassifikationsergebnisses als Dokumenttyp, sofern nicht
die Option
ausgewählt wurde. Es wird der, der Dokumentdefinition im OCR Mapping zugeordnete,
XBOUND Dokumenttyp gesetzt. Wurde das Dokument erfolgreich klassifiziert,
werden der Dokumententyp und alle Felder und Tabellen,
wie unter Klassifikationsoption
beschrieben, übernommen.
:
Markieren Sie diese Option, wenn Sie lediglich die
eines Dokuments klassifizieren möchten. In diesem Fall ist
eine Extraktion nicht möglich. ( Ablauf
bei der Verwendung dieser Option mit ABBYY FlexiCapture Extraction.) Jedes Medium wird einzeln als ein Stapel an
ABBYY übergeben. Bearbeitung des Stapels (das aktuellen Mediums)
durch ABBYY. Die Klassifikation des Mediums erfolgt
in ABBYY. Übernahme des Klassifikationsergebnisses als
Medientyp. Es wird der, der Dokumentdefinition im
OCR Mapping zugeordnete, XBOUND Dokumenttyp gesetzt.
Es werden keine Leseergebnisse übernommen. : Markieren Sie diese Option, wenn Sie
das Ergebnis der ABBYY / RecoStar
Klassifikation in ein Feld schreiben, den aktuellen
Dokumententyp aber nicht ändern möchten. Wählen Sie das Zielfeld
aus der Feldliste aus. (Die Feldliste wird automatisch für
jeden Dokumententyp angelegt.)
|
| Wählen Sie, wie mit nicht darstellbaren
Zeichen im Leseergebnis verfahren werden soll. Sie können diese
durch ein Fragezeichen ersetzen lassen oder sie im Leseergebnis
löschen. RecoStar: Wird nicht verwendet. |
| Markieren Sie diese Option, wenn Sie
alle Einträge der Liste ohne Zuordnung zu einem XBOUND Objekt
ausblenden möchten. |
ABBYY-spezifische Informationen
Das FC10-Projektverarbeitungsmodell wurde durch das FC10-Prozessorverarbeitungsmodell
ersetzt. Infolgedessen werden die Dokumentendefinitionen aus der Projektdatei
extrahiert und an den FC10-Prozessor übergeben. Somit sind die Projekteinstellungen
nichtig und die Dokumentendefinitionseinstellungen relevant.
Geraderichten und Drehen sind in ABBYY nicht unterstützt. Wenn benötigt,
sollten diese beiden Bildverarbeitungsfunktionen zuvor in separaten XBOUND-Prozessschritten
vorgenommen werden. Geänderte Bilder werden nicht aus ABBYY übernommen,
sondern nur Lese- und Klassifikationsergebnisse. In der Verification
würden falsche Zonen angezeigt werden, wenn wir Geraderichten zulassen,
aber gleichzeitig nicht geänderte Images übernehmen.
Verwandte Themen
Die
Aktivität ABBYY FlexiCapture Extraktion
Die
Aktivität RecoStar Professional Extraktion
© 2018 Kofax, Inc. All rights reserved. | Nutzungsbedingungen