Die Aktivität RecoStar FullPage Extraktion

Mit dieser Aktivität können Sie Dokumente mit dem RecoStar Full Page Reader auslesen.

Hinweis: Diese Aktivität darf derzeit nur einmal auf einem Server ausgeführt werden. Bei der Zuordnung dieser Aktivität zum XBOUND Activities-Dienst (siehe Anweisung in der XBOUND-Hilfe) darf also die Anzahl der Instanzen für diese Aktivität nur 0 oder 1 betragen.

Der Dateiname der Aktivität (falls Sie sie im Process Designer neu hinzufügen müssen) ist xboundActOcfRecoStarFullPageExtract.dll.

Die folgenden Einstellungen sind verfügbar, wenn Sie anhand dieser Aktivität einen Prozessschritt konfigurieren. (Für weitere Informationen siehe XBOUND-Hilfe.)

Sprache	Wählen Sie den zu verwendenden Sprachraum aus.
Leerseiten ignorieren	Markieren Sie diese Option, wenn Sie kein als Leerseiten markierte Dokumente auslesen möchten.
Ausschließlich unbearbeitete oder ungültige Dokumente bearbeiten	Markieren Sie diese Option, wenn Sie nur Dokumente erneut auslesen möchten, die noch nicht erfolgreich validiert wurden.
Klassifikations-/Extraktionsdauer in Unterdokumenten speichern	Markieren Sie diese Option, wenn Sie pro Dokument die Verarbeitungsdauer speichern möchten.
Zeichendaten speichern	Wählen Sie diese Option nur dann, wenn man Einzelzeicheninformationen benötigt. Dies ist zum Beispiel der Fall wenn man in der Verification mit der Lassofunktion nicht nur ganze Wörter sondern Wortteile auswählen möchte. Bei Aktivierung der Option wird im Datenmodell für jedes Zeichen ein Character-Objekt erzeugt, sonst nicht. Im letzteren Fall werden die Zeichen als ein String direkt am entsprechenden Word-Objekt gespeichert. Achtung: Bei Verwendung der Option erhöht sich der Arbeitsspeicherbedarf während der Extraktion und in der Verification signifikant.
Bildauswahl	Wählen Sie, ob die Extraktion vom TIFF oder vom JPEG erfolgen soll.
Anwenden auf folgende Dokumententypen	Markieren Sie diese Option, wenn Sie nur bestimmte Dokumente bestimmter Dokumententypen auslesen möchten. Markieren Sie alle auszulesenden Dokumententypen. Sollen auch Dokumente ohne Typ gelesen werden, markieren Sie die Option Kein Dokumenttyp.
OCR Daten exportieren	Markieren Sie diese Option, wenn Sie die ausgelesenen Daten und die zugehörigen Images z.B. für das Anlernen einer Klassifikation als Textdatei exportieren möchten. In das Eingabefeld Exportpfad legen Sie fest, in welchem Verzeichnis die Datei gespeichert werden soll.
OCR-Daten für ReadSoft Capture Components erzeugen	Die Leseergebnisse der RecoStar-Engine werden zur weiteren Verarbeitung der RCC bereitgestellt, indem der Engine-Name der Leseergebnisse auf "ReadSoft Capture Components" umgestellt wird. In der Anwendung RCF wird die Engine (OCR-Engine Name) als ReadSoft Capture Components statt RecoStarFpr angezeigt.

Auch folgende Einstellungen stehen zur Verfügung:

Import	Importiert Einstellungen für diesen Prozessschritt aus einer XML-Datei, die mit der Export-Funktion erstellt wurde.
Export	Speichert die Einstellungen dieses Prozessschrittes in einer XML-Datei. Geben Sie einen Dateinamen und ein Zielverzeichnis ein. Sie können dann diese Datei in einen anderen Prozessschritt desselben Typs importieren, um die gleichen Einstellungen zu erreichen.
Regulärer Ausdrücke überprüfen	Öffnet einen Testdialog, in dem Sie reguläre Ausdrücke überprüfen können.

ReadSoft Capture-Aktivitäten: Überblick

XBOUND Aktivitäten: Überblick (XBOUND-Hilfe Thema)