Document Transformation

L'étape Document Transformation permet d'extraire et d'utiliser des informations à partir d'images et de documents texte. Kofax RPA Document Transformation Service peut traiter les fichiers .png, .jpeg, .jpg, .tif, .tiff, .pdf, and .txt. Vous pouvez soumettre plusieurs documents soit sous la forme d'une archive .zip, soit sous la forme d'un chemin d'accès à un dossier contenant des fichiers. Si vous utilisez la fonction Séparation de document dans Kofax Transformation, Kofax RPA reçoit plusieurs documents dans lesquels vous pouvez naviguer via le navigateur Document Transformation.

Kofax RPA Document Transformation Service peut également traiter les demandes de traitement du langage naturel (NLP) en utilisant le projet Sentiment pour vous permettre de détecter l'humeur du texte, positive ou négative, et d'extraire des entités, telles que des noms de sociétés, des noms de personnes, etc. Vous pouvez utiliser le projet Sentiment pour traiter les commentaires des clients afin de déterminer si les clients sont satisfaits ou non du service. De plus, vous pouvez l'utiliser pour trouver toutes les mentions de votre entreprise dans un article. Le projet Sentiment peut être utilisé avec la version 6.3.1 ou une version ultérieure de KTT. Consultez le projet Sentiment dans Projets prédéfinis pour plus d'informations.

Workflow Document Transformation

L'activité Document Transformation traite vos documents graphiques ou PDF à partir d'un projet sélectionné. Un projet est un module qui traite et transforme vos documents à l'aide d'OCR et d'autres opérations spécifiques.

Le résultat du traitement est renvoyé au robot et ouvert dans le Document Transformation Browser, dans la Vue de l'enregistreur. Le service forme une arborescence d'éléments avec toutes les informations extraites. Notez que dans un document multipage, vous pouvez parcourir les pages à l'aide des boutons Précédent et Suivant de la barre d'outils du navigateur Document Transformation. Voir Navigateur de Document Transformation pour plus d'informations.

Les éléments dans l'arborescence contiennent des niveaux de confiance pour les résultats OCR et les autres résultats d'extraction définis par le projet. L'attribut confidence peut contenir des valeurs allant de zéro à un, la plus sûre étant un.

Propriétés des éléments dans un document transformé

Les attributs dérivés tels que der_x permettent de trouver l'élément et peuvent être utilisés dans les localisateurs.

Une fois que le document transformé est dans l'éditeur, vous pouvez déterminer si vous voulez effectuer la validation des résultats de la transformation. Si vous êtes satisfait des résultats de la transformation sans aucune validation, vous pouvez extraire et utiliser les données dans le document.

La validation est effectuée par le Document Transformation Thin Client. Cliquez sur Configurer les paramètres du proxy dans Document Transformation Browser pour envoyer le document au Thin client spécifié. Une URL unique est générée et renvoyée au robot. Le robot extrait l'URL et l'utilise pour envoyer le document à un utilisateur de validation, par exemple, par e-mail. L'utilisateur de validation clique sur l'URL, saisit les identifiants, puis le document contenant les données extraites s'ouvre. L'utilisateur de validation inspecte le document transformé et, si nécessaire, modifie les informations extraites dans le document.

Lors de la validation des documents, l'utilisateur peut activer la fonction d'apprentissage en ligne pour augmenter le taux de reconnaissance des champs sur des documents similaires. Cette fonction est basée sur la mémorisation de la mise en page d'un exemple de document, comme une facture. En complétant automatiquement les champs, en tapant manuellement ou en sélectionnant la valeur correcte dans le document, l'utilisateur contribue à la base de connaissances, ce qui améliore les résultats de l'extraction lorsque l'utilisateur travaillera sur un document similaire la prochaine fois.

Lorsque la validation est terminée, l'utilisateur de la validation marque le document comme étant valide. Lorsque le document est marqué comme valide, il est utilisé comme argument pour un robot spécifié dans l'option Rappel dans l'activité Document Transformation.

Pour inclure des métadonnées dans l'étape Ouvrir Document Transformation, exécutez l'étape Migrer, ensuite fermez et ouvrez le robot, puis cliquez sur Mettre à jour l'étape.

Propriétés des étapes

Activité

Sélectionnez une activité à effectuer en utilisant Kofax RPA Document Transformation Service.

URL du service

Indiquez une URL et un port si nécessaire pour l'ordinateur qui exécute Document Transformation Service. Si le service est installé localement, entrez localhost dans ce champ. L'URL doit comporter le préfixe http:// ou https://. Si vous utilisez le protocole https, le service d'hébergement web doit disposer d'un certificat accepté par des autorités de certification connues.

Type de projet
  • Projet par défaut : Cette option fournit un ensemble de projets prédéfinis. Voir Projets prédéfinis.

  • Projet personnalisé : Lorsque vous sélectionnez cette option, indiquez le chemin d'accès au projet pour traiter vos documents dans Chemin de projet personnalisé.

    Le Chemin de projet personnalisé fait référence au serveur Document Transformation Service. Il peut s'agir d'un chemin d'accès absolu ou d'un chemin d'accès relatif au dossier Document Transformation\\Projects.

Source du document

Sélectionnez la façon dont le robot localise un document à traiter.

  • Fichier local : Entrez le chemin d'accès à un ou plusieurs documents à traiter dans Nom du fichier. Utilisez un chemin d'accès complet à un fichier image, une archive .zip, un dossier contenant des fichiers ou un autre fichier du format pris en charge accessible depuis l'ordinateur qui exécute un robot.

  • Système de fichiers du robot : Saisissez le chemin d'accès au système de fichiers configuré et le nom du fichier, par exemple monpartage/doctotransform.pdf. Le nom du système de fichiers doit correspondre à celui spécifié dans la section Système de fichiers du robot dans la Management Console.

  • Variable binaire : Spécifiez une variable binaire qui contient un document.

Lorsqu'un chemin d'accès à plusieurs documents est spécifié, vous pouvez naviguer entre les documents à l'aide des boutons de la barre d'outils du navigateur Document Transformation.
Métadonnées

Sélectionnez cette option pour transmettre des données supplémentaires au Document Transformation Service.

Ces données sont ajoutées au document d'entrée sous forme de valeurs XValues, afin qu'elles puissent être utilisées par le projet Document Transformation Service. Les projets utilisent généralement les données pour affiner ou contrôler l'analyse. Les cas d'utilisation courants de cette option sont les paramètres de langue ou l'identification du client. Les XValues sont disponibles dans l'arborescence des dispositifs après que les documents traités aient été renvoyés par le Document Transformation Service.

Contactez le développeur de vos projets Document Transformation Service pour connaître les valeurs qui sont prises en charge par un projet.

Vous pouvez ajouter plusieurs paires de clé/valeur à la propriété Métadonnées.

Si une Clé apparaît plusieurs fois dans la liste, la valeur de la dernière occurrence est utilisée.

URL de validation
Sélectionnez cette option pour spécifier une URL pour le service Thin Client. Cette propriété est nécessaire pour envoyer les documents traités à la validation. L'URL est spécifiée dans la propriété ValidationService du Document Transformation Service. L'URL peut se présenter comme suit :

http://localhost:8082

Rappel
Sélectionnez cette option pour spécifier un robot que le service Thin Client doit appeler après la validation d'un document. Une fois la validation terminée, le robot est mis en file d'attente pour exécution dans la Management Console.

  • Projet de robot : Spécifiez le projet dans lequel réside le robot à appeler. Par exemple, Projet par défaut.

  • Nom et chemin du robot : Spécifiez le nom et le chemin du robot s'il réside dans un dossier du projet. Par exemple, MonRobot.robot ou dossier/sous-dossier/MonRobot.robot.

Une fois la validation terminée, les documents renvoyés au robot spécifié avec l'option Rappel contiendront le nom de l'utilisateur qui a validé le lot de documents. Ces informations seront fournies en tant que XValue avec le nom KDTS-ValidatingUser.

Pour trouver la Management Console pour mettre le robot de rappel en file d'attente, un robot avec l'étape Document Transformation utilise l'URL de la Management Console configurée pour le RoboServer dans lequel l'étape s'exécute. Lorsque le robot s'exécute dans Design Studio, il utilise l'URL de la Management Console qui est marquée comme « principale » dans Paramètres Design Studio. Lorsque le robot s'exécute dans une Management Console intégré, il utilise l'URL configurée avec le paramètre -mcUrl.

Ces URL configurées doivent utiliser le nom d'hôte ou l'adresse IP de l'ordinateur exécutant le Management Console. N'utilisez pas 'localhost', car le service Document Transformation ne peut pas atteindre la Management Console, et le robot de rappel ne sera pas mis en file d'attente.