Die Aktivität Leerseiten erkennen

Die Anwendung XBOUND Image Processing (Empty Page) ermittelt, ob das Bild von einer Leerseite stammt. Diese Anwendung verarbeitet alle TIFF- und JPEG-Medien des Basisdokuments und aller Unterdokumente (rekursiv). Das Ergebnis wird im Empty-Flag des Mediums under der Seite vermerkt. Viele XBOUND-Anwendungen können es berücksichtigen, um die Verarbeitung von Leerseiten zu unterdrücken.

ClosedFür die Experten: Der Algorithmus funktioniert wie folgt

  1. Das Innere des Bilds (dafür kann man die Breite der nicht berücksichtigten Randzone konfigurieren) wird in in ein Raster von rechteckigen Zonen unterteilt.

  2. Für jede Zone wird der Schwärzungsgrad (Anzahl schwarzer Pixel geteilt durch Anzahl weißer Pixel) berechnet.

  3. Für das Bild werden zwei Kenngrößen X und Y berechnet (diese haben nichts mit der Bildgeometrie zu tun):

    • X (Schwärzung) – Das arithmetische Mittel aller Schwärzungsgrade.

    • Y (Streuung) – Mittlere absolute Abweichung der Schwärzungsgrade von X, also die Summe über die Absolutbeträge der Differenz zwischen Schwärzungsgrad und X, geteilt durch die Anzahl der Zonen und durch X.

  4. Es wird geprüft, ob das ermittelte Paar (X, Y) oberhalb einer Schwellenlinie liegt, die sich ergibt, indem man in einem X-Y-Koordinatensystem die Punkte (0, Y0) und (X0, 0) verbindet. X0 ist dabei der Schwellwert X-Achse und Y0 ist der Schwellwert Y-Achse (siehe unten). Liegt das Paar (X, Y) unter dieser Schwellenlinie, wird das Bild als leer erkannt.

Der Algorithmus wägt also zwischen Gesamtschwärzung und Verteilung der schwarzen Pixel ab. Eine gleichmäßig geschwärzte Seite, deren Schwärzungsgrad unterhalb von X0 liegt, wird beispielsweise als leer erkannt.

Hinweis: Diese Aktivität muss zu einem Activities-Dienst zugeordnet werden. Andernfalls wird sie nicht ausgeführt.

Tipp: Verwenden Sie den Vorschau-Link, um das Ergebnis Ihrer Einstellungen zu testen.

Der Dateiname der Aktivität (falls Sie sie im Process Designer neu hinzufügen müssen) ist xboundActClassifyEmptyPages.dll.

Verfügbare Einstellungen

Die folgenden Einstellungen sind verfügbar, wenn Sie anhand dieser Aktivität einen Prozessschritt konfigurieren.

Registerkarte Eigenschaften

Anzahl Zonen

Anzahl der Zonen, auf denen der Erkennungsalgorithmus operiert. Eine höhere Anzahl von Zonen kann das Erkennungsergebnis verbessern, verlängert aber die Laufzeit dieser Funktion.

Maximale Dateigröße (Bytes)

Ist ein Medium größer, wird es nicht untersucht.

Nur auf TIFF-Bilder anwenden

Markieren Sie diese Option, um die Leerseiten nur auf Medien vom Format TIFF anzuwenden.

Nur auf Rückseiten anwenden

Markieren Sie diese Option, um die Leerseitenerkennung nur auf Rückseiten anzuwenden.

Storniere Medium

Markieren Sie diese Option, wenn ein als Leerseite klassifiziertes Medium storniert werden soll. Stornieren bedeutet, dass das Dokument von der weiteren Verarbeitung ausgeschlossen wird.

Zur Erkennung binarisieren

Markieren Sie diese Option, wenn das Bild vor der Verarbeitung binarisiert werden soll.

Diese Option muss für die Erkennung von Leerseiten in Farbe- oder Graustufenbilder wie JPEG ausgewählt werden. Die Binarisierung gilt nur in diesem Schritt und hat keine Wirkung auf andere Prozessschritte.

Dokumenttyp für Leerseiten

Wählen Sie einen Dokumenttyp aus, der einem Medium zugewiesen werden soll, wenn es als leer klassifiziert wurde.

Schwellwert X-Achse

Schwellwert für die Leerseitenermittlung in horizontaler Richtung. Empfohlener Wert ist 0.5.

Schwellwert Y-Achse

Schwellwert für die Leerseitenermittlung in vertikaler Richtung. Empfohlener Wert ist 2.5.

Analyse durchscheinender Vorderseiten anwenden

Diese Funktion vergleicht Vorder- und Rückseite auf Pixel-Ebene und ignoriert eventuell durchscheinende Pixel bei der Leerseitenerkennung. Sie wird nur bei normierten Dokumenttypen empfohlen, wenn dünnes Papier die Erkennung von Leerseiten beeinträchtigt.

Hinweis: Eine ganzheitliche Prüfung der Bildinhalte wird nicht durchgeführt. Daher muss vor produktivem Einsatz diese Funktion im Zusammenhang mit den zu verarbeitenden Bildern genau kalibriert und ausgiebig getestet werden.

Hinweis: Die Vorschau-Funktion kann das Ergebnis dieser Option nicht zeigen.

Distanz in Pixel

Der Parameter gibt an, um wieviele Pixel das Vorderseitenbild "aufgefettet" werden soll, bevor es in den Algorithmus eingeht. Auffetten bedeutet, dass alle schwarzen Figuren in alle Richtungen um n Pixel fetter gemacht werden. (ClosedWeitere Informationen.)

Scanner photographieren eine Seite, indem sie gleichzeitig ein Bild von der Vorderseite und der Rückseite machen. Dabei lässt es sich nicht vermeiden, dass die Vorderseite auf der Rückseite durchscheint und die Rückseite nicht mehr als leer klassifiziert wird. Daher versucht der Algorithmus, das Durchscheinen heraus zu rechnen. Dieser Parameter steuert, wie stark das Durchscheinen kompensiert wird.

Registerkarte Erweitert

Randgröße zum Analysebereich

Der Erkennungsalgorithmus schließt einen Randbereich dieser Breite von der Erkennung aus.

Einheit der Randgröße

Die Einheit der Randgröße.

Auch folgende Einstellungen stehen zur Verfügung:

Import

Importiert Einstellungen für diesen Prozessschritt aus einer XML-Datei, die mit der Export-Funktion erstellt wurde.

Export

Speichert die Einstellungen dieses Prozessschrittes in einer XML-Datei. Geben Sie einen Dateinamen und ein Zielverzeichnis ein. Sie können diese Datei dann in einen anderen Prozessschritt desselben Typs importieren, um die gleichen Einstellungen zu erreichen. Siehe Prozessschritte exportieren oder importieren.

Regulären Ausdrücke überprüfen

Öffnet einen Testdialog, in dem Sie (falls anwendbar) reguläre Ausdrücke überprüfen können.

Die Aktivität Bilder bearbeiten

XBOUND Aktivitäten: Überblick

Das Plug-in Process Designer