(.+?)<\/title>.+?<description>(.+?)<\/description>/g) { my $title = $1; my $description = $2; #----------------------------------------------------------------------------------- # nettoyage #----------------------------------------------------------------------------------- $description =~ s/<.+?>//g; $title =~ s/&//g; $description =~ s/xE[0-9]//g; if (!(exists $dico{$title})) { $dico{$title} = 1; #la valeur correspondant à la clef $titre est 1 print OUTPUT "Fichier : $file\n"; print OUTPUT "TITLE : $title.\n"; print OUTPUT "DESCRIPTION : $description\n\n"; print OUTPUT1 "<ITEM><TITLE>$title<\/TITLE><\/ITEM><DESCRIPTION>$description<\/DESCRIPTION>\n"; } } } close INPUT; } }# traitement du fichier est fini ! } #fin de parcours

#!/usr/bin/perl <:encoding(utf8)", "output1.txt") or die "NE PEUT PAS OUVIRE LE FICHIER !"; open (OUTPUT1, ">:encoding(utf8)", "output1.xml") or die "NE PEUT PAS OUVIRE LE FICHIER !"; print OUTPUT1 "\n"; print OUTPUT1 "\n"; print OUTPUT1 "Yuran ZHAO et Mingqiang WANG\n"; #print OUTPUT "".$DUMPFULL1."\n"; print OUTPUT1 "\n"; &parcours($repertoire); #appeller la fonction qui recupeter tous les fichies qu'on a besoin dans un repertoire arborescence et les traiter close OUTPUT; close OUTPUT1; sub parcours { my $path = shift(@_); #shift ==> retourne le premier element d'une liste # @_ ===> une liste #je veux ouvrir la liste de mon repertoire opendir(DIR, $path) or die "NE PEUT PAS OUVIRE LE REPERTOIRE !"; #je veux le lire my @file = readdir(DIR); closedir(DIR); foreach my $file (@file) { my @fichier = (@_); next if $file =~ /^\.\.?$/; #j'ignore le cas : nom de fichier est . ou .. # avec "=~" on peut lire un variable qui contient une expression reguliere $file = $path."/".$file; $fichier = $file; if (-d $file) #-d ==> test si $file a un repertoire (qui a une liste) { print " ========> ",$file,"\n"; &parcours($file); #recurse! print " =========> ",$file,"\n"; } #----------------------------------------------------------------------------------------- #Etape 2: je veux traiter tous les fichiers que on a trouvé : filtrage et nettoyer #----------------------------------------------------------------------------------------- if (-f $file) #-f ==>verifier si $file est un fichier normal { #je veux travaille sur uniquement les fichier xml if ($file =~ /.+\.xml/) { #je ouvert ce fichier open (INPUT, "<:encoding(utf8)", $file); #je cree un variable vide pour stoker le contenu my $texte = ""; while (my $ligne =) #filtrage { chomp $ligne; #supprime le retour de ligne $ligne =~s/\r//g; #enleve tous les "\r" $texte = $texte.$ligne; } #je ne veux pas l'espace entre les chevrons $texte =~ s/> +(.+?)<\/title>.+?<description>(.+?)<\/description>/g) { my $title = $1; my $description = $2; #----------------------------------------------------------------------------------- # nettoyage #----------------------------------------------------------------------------------- $description =~ s/<.+?>//g; $title =~ s/&//g; $description =~ s/xE[0-9]//g; if (!(exists $dico{$title})) { $dico{$title} = 1; #la valeur correspondant à la clef $titre est 1 print OUTPUT "Fichier : $file\n"; print OUTPUT "TITLE : $title.\n"; print OUTPUT "DESCRIPTION : $description\n\n"; print OUTPUT1 "<ITEM><TITLE>$title<\/TITLE><\/ITEM><DESCRIPTION>$description<\/DESCRIPTION>\n"; } } } close INPUT; } }# traitement du fichier est fini ! } #fin de parcours