Der Dialog OCR Mapping

ClosedSo rufen Sie diesen Dialog auf:

  1. Öffnen Sie eine Management Center-Konsole mit dem Plug-in Process Designer. (Informationen zum Arbeiten mit Konsolen und mit dem Process Designer finden Sie in der XBOUND-Hilfe.)

  2. Klicken Sie links unter Prozess Navigation den gewünschten Prozess an.

  3. Klicken Sie rechts unter Prozess auf die Schaltfläche Prozessdesign:

  4. Im Bereich Prozess, erstellen Sie oder öffnen Sie einen ABBYY FlexiCapture Extraction- oder RecoStar Professional Extraction-Prozessschritt.

  5. Klicken Sie auf die Schaltfläche OCR Mapping.

Im Mappingdialog können Sie die Dokumentklassifikation und -extraktion einstellen. Außerdem nehmen Sie hier die Zuordnung von Leseergebnissen zu XBOUND-Feldern vor.

Der linker Bereich

Auf der linken Seite der Liste sehen Sie alle in ABBYY / RecoStar definierten Dokumentvorlagen und deren Felder. Auf der rechten Seite wird die Zuordnung der Vorlagen und Felder zu XBOUND-Dokumenttypen und -Feldern angezeigt.

Klicken Sie auf eine Zeile, um die XBOUND Zuordnung zu ändern. Der Dialog XBOUND Objektauswahl wird angezeigt, in dem Sie das/die zuzuordnenden XBOUND Objekte auswählen, ein neues XBOUND Objekt hinzufügen oder die XBOUND Zuordnung aufheben können. Neu in XBOUND anzulegende Objekte werden blau kursiv dargestellt. Beim Schließen des Mappingdialogs werden diese in XBOUND erstellt.

ClosedWeitere Informationen zum Mapping der Aktivität RecoStar Professional Extraction:

  • RecoStar-Operatoren vom Typ BoxReadField werden unterstützt. Dieser Operator sucht nach einem (eventuell unterteilten) Feld innerhalb einer bestimmten geometrischen Zone und liest den Inhalt. Das Ergebnis wird im XBOUND als OCRResult und als Wert des zum BoxReadField zugeordneten Feldes gespeichert.

  • Auch der PixelCountField-Operator wird unterstützt. Dieser zählt die schwarzen Pixel in der durch Zone definierte Region.

    Hinweise

    • Der Wert des zum PixelCountField zugeordneten Feldes wird X, wenn der Wert zwischen PixelMinRatio und PixelMaxRatio liegt, sonst O (der Buchstabe "O").

    • Confidence Rank wird am FieldValue gespeichert. Er ist "OK" wenn PixelCountField.IsInRange = true, sonst "Reject".

    • Für jedes PixelCountField-Ergebnis wird ein OMRResult im EngineResult mit folgender Eigenschaftenzuordnung angelegt:

      • OMRResult.Blackness = PixelCount.Percentage

      • OMRResult.Checked = PixelCount.IsInRange

      • OMRResult.Confidence = 1 falls PixelCount.IsInRange = true, sonst 0.

Der rechter Bereich
Klassifikation
  • Keine:Markieren Sie diese Option, wenn ABBYY / RecoStar nicht klassifizieren soll. ABBYY / RecoStar verwendet die Dokumentvorlage zum Auslesen, welche dem aktuellen Dokumenttyp zugeordnet ist.
    (ClosedAblauf bei der Verwendung dieser Option mit ABBYY FlexiCapture Extraction.)

    1. XBOUND übergibt alle Medien eines Dokuments als ein Stapel an ABBYY.

    2. Ist die Option Prüfen, ob die Anzahl der Images mit der Dokumentdefinition übereinstimmt... aktiviert, dann wird ermittelt, wie viele Seiten anhand der, dem aktuellen XBOUND Dokumenttyp zugeordneten, Dokumentdefinition erwartet werden (Anzahl der Seiten aller Dokumentsektionen).

      • Stimmt die Anzahl überein, dann wird das Dokument an ABBYY zur Bearbeitung übergeben

      • In allen anderen Fällen wird eine Fehlermeldung ausgegeben: "Die Anzahl der Seiten im Dokumententemplate [99] stimmt nicht mit der Anzahl der Seiten am Dokument [99] überein."

    3. Bearbeitung des Stapels (das aktuellen Dokuments) durch ABBYY.

    4. Übernahme des Klassifikationsergebnisses als Dokumenttyp, sofern nicht die Option Klassifikationsergebnis in Feld schreiben ausgewählt wurde. Es wird der, der Dokumentdefinition im OCR Mapping zugeordnete, XBOUND Dokumenttyp gesetzt.

    5. Alle Dokumentsektionen werden durchlaufen. In ihnen werden die Feldbereiche und deren Felder durchlaufen und die Werte der Felder/Tabellen in XBOUND übernommen. Welches ABBYY Feld in welches XBOUND Feld übernommen wird, wird im OCR Mapping definiert.

    6. Alle Feld-/Tabellenzellenwerte werden wie folgt in XBOUND übernommen. Jedem Feld wird seine Position auf dem Image mitgegeben. Bei Textfeldern werden zusätzlich die gelesenen Zeichen und ihre Konfidenz übernommen

      Feldtyp

      Übernommener Wert

      FT_CheckmarkAsBoolean
      FT_CheckmarkGroupAsString
      FT_CurrencyFieldAsString

      FT_DateTimeField

      AsDateTime als LongDateString

      FT_Document

      Nicht implementiert (keine Übernahme in ein XBOUND Feld)

      FT_Group

      Nicht implementiert (keine Übernahme in ein XBOUND Feld)

      FT_NumberField

      AsDouble

      FT_PageGroup

      Nicht implementiert (keine Übernahme in ein XBOUND Feld)

      FT_PictureField

      Nicht implementiert (keine Übernahme in ein XBOUND Feld)

      FT_TextField

      AsString

      OMR Felder werden als 0 oder 1 Werte in XBOUND abgebildet.

  • Dokument klassifizieren: Markieren Sie diese Option, wenn ABBYY / RecoStar das Dokument klassifizieren und auslesen soll. Zur Übernahme des Klassikationsergebnisses bei mehrseitigen Formularen siehe die Beschreibung der Option Dokument als mehrseitiges Formular verarbeiten in der Aktivität RecoStar Professional Extraction.
    (ClosedAblauf bei der Verwendung dieser Option mit ABBYY FlexiCapture Extraction.)

    1. XBOUND übergibt alle Medien eines Dokuments als ein Stapel an ABBYY.

    2. Bearbeitung des Stapels (das aktuellen Dokuments) durch ABBYY inklusive Klassifikation.

    3. Übernahme des Klassifikationsergebnisses als Dokumenttyp, sofern nicht die Option Klassifikationsergebnis in Feld schreiben ausgewählt wurde. Es wird der, der Dokumentdefinition im OCR Mapping zugeordnete, XBOUND Dokumenttyp gesetzt.

    4. Wurde das Dokument erfolgreich klassifiziert, werden der Dokumententyp und alle Felder und Tabellen, wie unter Klassifikationsoption Keine beschrieben, übernommen.

  • Medien klassifizieren: Markieren Sie diese Option, wenn Sie lediglich die Medien eines Dokuments klassifizieren möchten. In diesem Fall ist eine Extraktion nicht möglich.
    (ClosedAblauf bei der Verwendung dieser Option mit ABBYY FlexiCapture Extraction.)

    1. Jedes Medium wird einzeln als ein Stapel an ABBYY übergeben.

    2. Bearbeitung des Stapels (das aktuellen Mediums) durch ABBYY. Die Klassifikation des Mediums erfolgt in ABBYY.

    3. Übernahme des Klassifikationsergebnisses als Medientyp. Es wird der, der Dokumentdefinition im OCR Mapping zugeordnete, XBOUND Dokumenttyp gesetzt.

    Es werden keine Leseergebnisse übernommen.

  • Klassifikationsergebnis in Feld schreiben: Markieren Sie diese Option, wenn Sie das Ergebnis der ABBYY / RecoStar Klassifikation in ein Feld schreiben, den aktuellen Dokumententyp aber nicht ändern möchten. Wählen Sie das Zielfeld aus der Feldliste aus. (Die Feldliste wird automatisch für jeden Dokumententyp angelegt.)

Nicht darstellbare Zeichen

Wählen Sie, wie mit nicht darstellbaren Zeichen im Leseergebnis verfahren werden soll. Sie können diese durch ein Fragezeichen ersetzen lassen oder sie im Leseergebnis löschen.

RecoStar: Wird nicht verwendet.

Filter

Markieren Sie diese Option, wenn Sie alle Einträge der Liste ohne Zuordnung zu einem XBOUND Objekt ausblenden möchten.

ABBYY-spezifische Informationen

Das FC10-Projektverarbeitungsmodell wurde durch das FC10-Prozessorverarbeitungsmodell ersetzt. Infolgedessen werden die Dokumentendefinitionen aus der Projektdatei extrahiert und an den FC10-Prozessor übergeben. Somit sind die Projekteinstellungen nichtig und die Dokumentendefinitionseinstellungen relevant.

Geraderichten und Drehen sind in ABBYY nicht unterstützt. Wenn benötigt, sollten diese beiden Bildverarbeitungsfunktionen zuvor in separaten XBOUND-Prozessschritten vorgenommen werden. Geänderte Bilder werden nicht aus ABBYY übernommen, sondern nur Lese- und Klassifikationsergebnisse. In der Verification würden falsche Zonen angezeigt werden, wenn wir Geraderichten zulassen, aber gleichzeitig nicht geänderte Images übernehmen.

Die Aktivität ABBYY FlexiCapture Extraktion

Die Aktivität RecoStar Professional Extraktion

© 2018 Kofax, Inc. All rights reserved. | Nutzungsbedingungen