#/usr/bin/perl <:encoding(utf-8)","BAO1_XMLRSS_$rubrique.txt"); open(OUTXML,">:encoding(utf-8)","BAO1_XMLRSS_$rubrique.xml"); print OUTXML "\n"; #------------------------------------------------------------------ <\n"; &parcoursarborescencefichiers($rep); print OUTXML ""; close OUTTXT; close OUTXML; exit; #------------------------------------------------------------------ # Fonction qui parcourt l'arborescence de fichiers par récursivité sub parcoursarborescencefichiers { my $path = shift(@_); opendir(DIR, $path) or die "can't open $path: $!\n"; my @files = readdir(DIR); closedir(DIR); foreach my $file (@files) { next if $file =~ /^\.\.?$/; $file = $path."/".$file; if (-d $file) { print " ==> ",$file,"\n"; &parcoursarborescencefichiers($file); print " ==> ",$file,"\n"; } if (-f $file) { if ($file =~/$rubrique.+xml$/){ print "<",$i++,"> ==> ",$file,"\n"; eval {$rss->parsefile($file); }; if( $@ ) { $@ =~ s/at \/.*?$//s; print STDERR "\nERROR in '$file':\n$@\n"; } else { print OUTXML "\n"; foreach my $item (@{$rss->{'items'}}) { my $description=$item->{'description'}; my $title=$item->{'title'}; $title=~s/<[^>]+>//g; $description=~s/<[^>]+>//g; $compteur++; if (!(exists ($dico_des_titres{$title}))) { $dico_des_titres{$title}=1; my($titre_nettoye,$description_nettoye) = &nettoyage1($title,$description); my($titre_nettoye_XML,$description_nettoye_XML) = &nettoyage2($title,$description); print OUTTXT "$titre_nettoye\n$description_nettoye\n--------------------\n"; print OUTXML "\t\n\t\t$titre_nettoye_XML\n\t\t$description_nettoye_XML\n\t\n"; } } print OUTXML "\n"; } } } } } #------------------------------------------------------------------ # Procédure de nettoyage préliminaire des fichiers txt avant le traitement du contenu textuel sub nettoyage1 { my ($titre,$description)=@_; $description=~s///; $description=~s/<.+?>//g; $description=~s/'/'/g; $description=~s/"/"/g; $description=~s/&/&/g; $description=~s/([^\.])$/$1./g; $titre=~s///; $titre=~s/<.+?>//g; $titre=~s/'/'/g; $titre=~s/"/"/g; $titre=~s/&/&/g; $titre=~s/([^\.])$/$1./g; return $titre,$description; } # Procédure de nettoyage préliminaire des fichiers xml avant le traitement du contenu textuel sub nettoyage2 { my ($titre,$description)=@_; $description=~s///; $description=~s/<.+?>//g; $description=~s/'/'/g; $description=~s/"/"/g; $description=~s/&(?!amp;)/&$1/g; $description=~s/([^\.])$/$1./g; $titre=~s///; $titre=~s/<.+?>//g; $titre=~s/'/'/g; $titre=~s/"/"/g; $titre=~s/&(?!amp;)/&$1/g; $titre=~s/([^\.])$/$1./g; return $titre,$description; }