Traiter l’arborescence des fichiers :

Retour

Sommaire:

1.Utilisation du programme:

Usage : perl   parcours-arborescence-fichiers.pl    nom-du-repertoire

Entrée : une arborescence de répertoires contenant les fichiers à traiter.

Sortie : un document XML contenant sur chaque ligne le nom du fichier source et le contenu textuel obtenu
(la sortie pour l’exemple fourni).

Source : le programme commenté est disponible ici .

Le source au format texte est disponible ici.

2.Fonctionnement :

La procédure « parcoursarborescencefichier » effectue les traitements suivants :

Si l’élément passé en entrée est un répertoire, la procedure « parcoursarborescencefichier »
sera appelée de nouveau pour traiter son contenu (récursivité).

Si l’élément est un fichier XML, on charge son contenu dans une variable. Pour
stocker le nom de ce fichier, on crée une balise qu’on ajoute au document
de sortie.

On extrait le contenu des balises description grâce à l’expression régulière : ~s/<description>([^<]*)<\/description>//.

Le contenu textuel de toutes les balises du fichier sera représenté dans le document de sortie sous la forme :

<CONTENU> texte filtré </CONTENU>

Le schéma suivant décrit le fonctionnement :

Haut de page

Haut de page

3.Exemple :

1. Arborescence de départ:

2. On lance le programme:

perl    parcours-arborescence-fichiers.pl  2005/

3. Résultats:

Le fichier XML est disponible ici.
Le résultat au format HTML est disponible ici.

Haut de page