Alternatives de gestion des erreurs

Vous pouvez sélectionner plusieurs méthodes alternatives pour gérer les erreurs. Voir Conditions et gestion des erreurs pour un aperçu du traitement des erreurs.

Supposons qu'une partie d'une page web présente une structure et une mise en page variables, mais qu'elle se résume toujours à l'un des trois cas suivants. Dans chaque cas, il existe des informations à extraire. Il est possible de procéder en tentant l'extraction un cas à la fois. Si le premier cas échoue, le cas suivant est tenté, jusqu'au troisième pour lequel nous supposons que l'extraction aboutit.


Alternatives de gestion des erreurs

Notez les icônes (Essayer l'alternative suivante) sur les étapes d'extraction. Si l'extraction échoue, la branche suivante de l'Étape de tentative est exécutée (si une branche sortant d'une Étape de tentative aboutit, la branche suivante n'est pas exécutée). Les étapes Extraire font deux choses à la fois : Elles exécutent l'extraction à partir de la page web, et si c'est impossible, elles garantissent que l'approche suivante est essayée. Notez que si l'une des deux étapes de la première branche échoue, la deuxième branche est exécutée ; c'est un exemple de la façon dont la « condition de réussite » d'une branche peut être exprimée par une combinaison d'étapes.

Cette approche fonctionne mieux si la « troisième façon » d'extraire doit aboutir (par exemple, en appliquant un ensemble fixe de valeurs par défaut plutôt qu'en extrayant réellement les données de la page web). Si la troisième branche accède à la page web comme le font les deux premières branches, il n'est peut-être pas judicieux de penser qu'elle aboutira. Lors de la prochaine exécution du robot, le site web aura peut-être tellement changé qu'aucune des trois stratégies ne réussira, et le robot devra être capable de réagir de manière raisonnable.

La façon la plus simple de répondre est de signaler le problème à l'appelant et de l'enregistrer, en renonçant à faire l'extraction et tout ce qui suit. Cela peut être réalisé en faisant en sorte que la troisième branche informe l'Étape de tentative si elle ne fait pas son travail, comme les deux premières branches.


Alternatives de gestion des erreurs

(Pour une Étape de tentative, Ignorer les étapes suivantes signifie qu'aucune autre activité n'est exécutée en dehors de la déclaration et de la consignation).

Il est également possible de faire en sorte que l'Étape de tentative propage le problème à une Étape de tentative antérieure pour le traitement. Pour plus d'informations, consultez la section Tentative-Récupération.