-- Boîte à outils 1 --

Dans la BAO 1, nous avons créé des scripts de filtrage et de nettoyage des flux RSS.

Voici ces deux scripts dans leur état initial :

Script filtreur


flèche

Script nettoyeur


flèche


Il sera par la suite nécessaire d'intégrer ces deux scripts dans un troisième qui a pour but de parcourir l'arborescence dans laquelle sont mis les fils RSS. Voici ce script :

Script qui parcourt l'arborescence


flèche

Script nettoyeur-filtreur modifié


flèche


Dans l'étape suivante, on intègre les scripts de filtrage et de nettoyage dans le parcours de l'arborescence. On ajoute également des lignes qui permettent d'enlever les doublons (répétition de certaines lignes dans les flux RSS) et les images (balises images). Voici le script :

Parcours de l'arborescence avec nettoyage et filtrage


flèche


Voici un extrait de ce que l'on obtient en sortie :

Au large de la Vendée, cette terre reste sauvage hors saison.
Rites et vertus curatives des bains dans cette île du nord-est du Japon.
Palaces et surf, dans la station balnéaire de la côte basque.
Autour de Cap Canaveral, les parcs d'attractions permettent de patienter.
L'optimisme de la Chine et de l'Inde contraste avec les craintes de l'Occident.
La "diversité corporelle", nouvel "archétype esthétique".
L'avocat général avait requis une "peine de principe".
L'objectif de la commission Copé est une suppression totale en 2011.
Mieux vaut être riche et citadin que pauvre et habitant une zone rurale !
La chronopharmacologie pour optimiser les traitements.
La golfeuse mexicaine aborde le tournoi de Nabisco en numéro 1 mondial.
La Mexicaine gagne son 2e tournoi majeur.


Chaque ligne contient le contenu d'une balise description d'un flux A la Une.