Nous avons réalisé cette BAO sous deux versions :
- une version utilisant les expressions régulières que vous pouvez retrouver ici
- une version utilisant la bibliothèque XML::RSS (adaptée au traitement de fichiers XML RSS) que vous pouvez retrouver ici
Nous avons aussi décidé d’ajouter des attributs dans les balises - correspondant au numéro de l’item traité (c’est-à-dire son compteur) et à la date du fil RSS correspondant, pour garder une certaine trace des fils RSS traités.
Par ailleurs, nous ne traitons que les items distincts, c’est-à-dire que nous ne voulons pas de doublons.
Nous exécutons l'une des commandes ci-dessous en nous positionnant sur le répertoire ProjetEncadré, qui contient toute notre arborescence de travail:
perl ./BAO1/BAO1_ParcoursArborescence_RegExp.pl 2020 n°_rubrique
ou
perl ./BAO1/BAO1_ParcoursArborescence_XMLRSS.pl 2020 n°_rubrique
Les deux versions de la BAO donnent les mêmes résultats.