Aktivität zum Erkennen von Leerseiten

Diese Aktivität ermittelt, ob das Bild von einer Leerseite stammt. Sie untersucht alle TIFF- und JPEG-Medien des Stammdokuments und sämtlicher Unterdokumente (rekursiv). Das Ergebnis wird in der Empty-Flag der Seite und des Mediums gespeichert. Viele XBOUND Aktivitäten können die Verarbeitung dieser Leerseiten überspringen, wenn sie dafür konfiguriert werden.

ClosedFür Experten: So funktioniert der Algorithmus

  1. Der innere Bildbereich (der durch eine konfigurierbare Begrenzung definiert wird) wird in ein Raster mit rechteckigen Zonen aufgeteilt.

  2. Für jede Zone wird der Schwärzungsgrad (Anzahl schwarzer Pixel geteilt durch Anzahl weißer Pixel) berechnet.

  3. Es werden zwei Einstellungen berechnet (die unabhängig von der Geometrie des Bildes sind):

    • X (Schwärzungsgrad) – Durchschnitt aller Werte für den Schwärzungsgrad.

    • Y (Abweichung) – Durchschnittliche absolute Abweichung der Werte für den Schwärzungsgrad von X. Dies ist die Summe der absoluten Werte der Unterschiede zwischen Schwärzungsgrad und X, geteilt durch die Anzahl an Zonen und durch X.

  4. Danach wird überprüft, ob der errechnete Wert (X, Y) über dem Schwellenwert zwischen den Eckpunkten (0, Y0) und (X0, 0) in einem kartesischen Koordinatensystem liegt. X0 ist der Schwellenwert der X-Achse und Y0 ist der Schwellenwert der Y-Achse (siehe unten). Wenn der Wert (X, Y) unterhalb dieses Schwellenwerts liegt, wird das Bild als leer angesehen.

  5. Der Algorithmus wägt also zwischen Gesamtschwärzung und Verteilung der schwarzen Pixel ab. Eine gleichmäßig geschwärzte Seite, deren Schwärzungsgrad unterhalb von X0 liegt, wird beispielsweise als leer erkannt.

Tipp: Testen Sie die Ergebnisse Ihrer Einstellungen anhand des Vorschau-Links.

Hinweis: Diese Aktivität muss zu einem Activities-Dienst zugeordnet werden. Andernfalls wird sie nicht ausgeführt.

Der Dateiname der Aktivität (falls Sie sie im Process Designer neu hinzufügen müssen) ist xboundActClassifyEmptyPages.dll.

Verfügbare Einstellungen

Die folgenden Einstellungen sind verfügbar, wenn Sie anhand dieser Aktivität einen Prozessschritt konfigurieren.

Registerkarte Eigenschaften

Anzahl Zonen

Angabe, in wie vielen Bereichen der Erkennungsalgorithmus verwendet wird. Das Ergebnis kann durch Festlegung weiterer Bereiche verbessert werden, wobei die Bearbeitungsdauer dann auch steigt.

Maximale Dateigröße (KByte)

Wenn ein Medium größer als die angegebene Größe ist, wird es nicht analysiert.

Nur auf TIFF-Bilder anwenden

Es werden nur TIFF-Medien überprüft.

Nur auf Rückseiten anwenden

Es werden nur Rückseiten überprüft.

Storniere Medium

Wenn eine Seite als Leerseite klassifiziert ist, wird sie storniert (und damit von XBOUND nicht weiter verarbeitet).

Zur Erkennung binarisieren

Legt fest, ob ein Bild vor Verarbeitung binarisiert wird.

Sie müssen diese Einstellung auswählen, wenn Sie Leerseiten in Farb- oder Graustufen-Bildern wie JPEG-Dateien erkennen. Die Binarisierung findet nur in diesem Schritt Anwendung und wirkt sich nicht auf andere Prozessschritte aus.

Dokumenttyp für Leerseiten

Wählen Sie einen Dokumenttyp aus, der dem Medium zugewiesen werden soll, wenn es als Leerseite erkannt wird.

Schwellwert X-Achse

Schwellenwert-Einstellung für die Erkennung von Leerseiten (horizontale Ausrichtung). Der Wert 0,5 wird empfohlen.

Schwellwert Y-Achse

Schwellenwert-Einstellung für die Erkennung von Leerseiten (vertikale Ausrichtung). Der Wert 2,5 wird empfohlen.

Analyse durchscheinender Vorderseiten

Diese Funktion vergleicht nicht-leere Rückseiten mit Vorderseiten auf Pixelebene, sodass Pixel, die auf die andere Seite durchscheinen, ausgeschlossen werden können. Diese Funktion wird nur für standardisierte Dokumenttypen empfohlen, wenn das Papier dünn und leicht transparent ist.

Hinweis: Diese Funktion führt keine umfassende Analyse des Bildinhalts durch. Daher muss sie anhand der tatsächlich zu verarbeitenden Bilder sorgfältig kalibriert und dann umfassend getestet werden, bevor sie in der Produktionsumgebung verwendet wird.

Hinweis: Die Funktion Vorschau zeigt nicht die Ergebnisse dieser Option an.

Distanz (in Pixel)

Dieser Parameter legt fest, wie viele Pixel des Bildes auf der Vorderseite "verstärkt" werden müssen, bevor der Algorithmus angewendet wird. Verstärken bedeutet, dass alle schwarzen Zeichen in alle Richtungen um n Pixel ergänzt werden. (ClosedWeitere Informationen.)

Scanner fotografieren die Vorder- und Rückseite gleichzeitig. Dabei ist es unvermeidlich, dass die Vorderseite durchscheint, sodass die Rückseite nicht mehr als leer angesehen wird, obwohl sie letztendlich leer ist. Daher versucht der Algorithmus vorherzusehen, welche Seiten durchscheinend sind. Dieser Parameter steuert, wie stark das Durchscheinen kompensiert wird.

Registerkarte Erweitert

Randbreite

Schließt einen Rand dieser Breite von der Erkennung aus.

Einheit der Randgröße

Einheit der Randgröße.

Auch folgende Einstellungen stehen zur Verfügung:

Import

Importiert Einstellungen für diesen Prozessschritt aus einer XML-Datei, die mit der Export-Funktion erstellt wurde.

Export

Speichert die Einstellungen dieses Prozessschrittes in einer XML-Datei. Geben Sie einen Dateinamen und ein Zielverzeichnis ein. Sie können diese Datei dann in einen anderen Prozessschritt desselben Typs importieren, um die gleichen Einstellungen zu erreichen. Siehe Prozessschritte exportieren oder importieren.

Regulären Ausdrücke überprüfen

Öffnet einen Testdialog, in dem Sie (falls anwendbar) reguläre Ausdrücke überprüfen können.

Die Aktivität Bilder bearbeiten

XBOUND Aktivitäten: Übersicht

Plugin Process Designer