RecoStar Professional Extraction-aktiviteten

Aktiviteten används för att klassificera och extrahera dokument med RecoStar Professional.

Obs: Aktiviteten kan bara köras en gång per server. När aktiviteten tilldelas till en XBOUND Activities Service (se instruktioner i XBOUND-Hjälpen) måste alltså antalet instanser av den här aktiviteten vara 0 eller 1.

Om du av någon anledning behöver lägga till aktiviteten i XBOUND Process Designer, lägger du till filenxboundActOcfRecoStarProfExtract.dll.

Följande inställningar finns tillgängliga när du konfigurerar ett processteg för denna typ av aktivitet. (Du hittar mer information om att konfigurera processteg i XBOUND-hjälpen.)

Projektfil

Inställningarna för klassificeringen och extraktionen sparas i en projektfil som skapas med RecoStar Design Studio. Ange filens sökväg här.

Bearbeta endast obearbetade eller ogiltiga dokument

Välj om du endast vill extrahera dokument som inte har validerats än.

Spara klassificerings-/extraktionstiden i underdokument

Välj detta om du vill spara bearbetningstiden per dokument.

Använd region från projekt för okända fält

Välj detta om du vill hämta den angivna fältzonen om inget fältvärde har lästs.

Bearbeta dokument som flersidigt formulär

Välj detta om du vill bearbeta flersidiga dokument. Om du väljer detta måste varje sida tillhandahållas som ett separat medium. Fält som extraheras på sidorna överförs till XBOUND utifrån den konfigurerade mappningen. Fältnamnen på alla formulär måste vara unika för att inga värden ska skrivas över.

Vid flersidiga dokument brukar RecoStar-projektet innehålla ett separat formulär för varje sida. När RecoStar-formulär mappas till dokumenttyper i XBOUND brukar endast den första sidans fastställda formulär beaktas.

Ta bort alla befintliga fältvärden vid upprepad extraktion

Vid upprepad extraktion av ett dokument brukar det redan finnas fältvärden. Standardinställningen är att nya fältvärden läggs till befintliga värden. Om du väljer detta alternativ kommer de befintliga värdena att tas bort först. Detta sker endast i fält där det finns nya fältvärden.

Med helsides-OCR

Välj om du vill utföra en ytterligare helsidesavkänning. För att detta ska utföras läggs ett nytt FullPageField med namnet "_FullPageField_" till i RecoStar-projektet när det körs. Resultatet hämtas som ett XBOUND-motorresultat.

Använd OCR-bild

 

Med detta alternativ kan bilder som förbearbetats i RecoStar (räta upp, ta bort fläckar och liknande) hämtas som nya XBOUND-media. Fältgeometrin kommer i detta fall att anpassas och extraktionsresultaten läggs till den nya bilden. Det hämtade mediet refereras med ett nytt mediefält med namnet "ReferenceToOriginalMedium" med originalmediets identifierare.

Bildval

Välj om du vill extrahera TIFF- eller JPEG-bilder.

Tillämpa på följande dokumenttyper

Välj om du endast vill extrahera dokument med specifika dokumenttyper. Sedan väljer du vilka dokumenttyper som ska extraheras. Om du också vill extrahera dokument utan någon typ väljer du alternativet Ingen dokumenttyp.

Licenstyp

Välj vilken typ av RecoStar-licens du har och vill använda för projektet.

Knappen OCR-mappning

Öppnar dialogrutan OCR-mappning där du kan konfigurera hur dokument ska klassificeras och tilldela tolkade resultat till XBOUND-fält.

Följande inställningar finns också tillgängliga:

Knappen Importera

Importerar inställningar från en XML-fil som skapats genom Exportera.

Knappen Exportera

Exporterar inställningarna till en XML-fil. Ange filens namn och plats. Du kan sedan importera XML-filen för att få samma inställningar.

Länken Kontrollera reguljärt uttryck

Öppnar ett testformulär där du kan kontrollera ett reguljärt uttryck.

ReadSoft Capture Framework-aktiviteter: Översikt

XBOUND-aktiviteter: Översikt (Avsnitt i XBOUND-hjälpen)