Effectuer des tâches communes
Extraction d'une partie seulement d'un texte
Pour n'extraire qu'une partie du texte dans une balise, vous pouvez utiliser des expressions rationnelles sur le texte de la balise. Par exemple, vous pouvez extraire le nom « Bob Smith » du texte suivant : « L'article est écrit par Jean Fèvre ». Pour ce faire, utilisez le convertisseur de données Extraire les données (à ne pas confondre avec l'étape Extraire) et configurez-le comme décrit dans cette rubrique.
Dans cet exemple, le modèle utilisé est ".*par\s(.*)\", ce qui signifie que le texte entre « par » et le point sera mis en correspondance par une sous-expression rationnelle. Pour plus d'informations, consultez Expressions rationnelles.
- Ouvrez Extraire la configuration, puis sélectionnez l'onglet Basique.
-
Dans le champ Expression rationnelle, entrez l'expression rationnelle du texte à extraire.
Configurez la propriété Expression rationnelle pour qu'elle corresponde à l'ensemble du texte, le texte à extraire étant associé à un sous-expression rationnelle, entre parenthèses.
Conversion du contenu
Pour normaliser le contenu, utilisez la fonction Conversion, par exemple, en remplaçant le texte par un autre texte. Par exemple, pour normaliser les codes de pays dans leur description en langage naturel, par exemple, normaliser "US" en "États-Unis".
-
Pour les conversions de texte simple, utilisez le convertisseur de données Convertir à l'aide de liste.
-
Pour les conversions basées sur des expressions naturelles ou des expressions, utilisez le convertisseur de données Si alors.
Extraction et formatage des nombres
- Pour extraire un nombre d'un contenu, ajoutez un convertisseur de données Extraire le nombre.
- Pour effectuer un formatage supplémentaire des nombres, utilisez le convertisseur de données Formater le nombre.
Extraction de la date du texte
L'extraction des dates doit se faire de la même manière que l'extraction des chiffres.
-
Pour extraire une date du texte, ajoutez un convertisseur de données Extraire la date à votre robot.
Extraire la date utilise des expressions rationnelles pour extraire la date. L'expression rationnelle ne doit pas nécessairement correspondre à l'ensemble du texte, mais seulement à la date. La date extraite est convertie au format de date standard.
- Pour effectuer un formatage supplémentaire de la date, utilisez le convertisseur de données Formater la date.
Extraction d'un sous-ensemble de balises uniquement dans une balise trouvée
Parfois, vous souhaitez extraire des informations d'une plage de balises plutôt que d'une seule.
Supposons que vous voulez extraire le texte du corps d'une article, où le corps du texte est composé de sections individuelles, chacune dans sa propre balise, et où les informations sur le titre et l'auteur de l'article sont contenues dans d'autres balises. Pour extraire uniquement le texte du corps sans le titre et l'auteur de l'article, utilisez l'activité Extraire pour extraire le texte, et configurez l'activité de manière à ce que seule la plage de balises couvrant le corps soit extraite.