Série 2 : Etiquetage


Cordial



On soumet à Cordial un fichier texte contenant l'ensemble des balises <description> (cf série 1).
On obtient cet étiquetage.
Grâce au programme ci-dessous on obtient un fichier xml, qui après application d'une feuille de style offre cette visualisation.


#!/usr/bin/perl

$arg = $ARGV[0];
$arg=~s/(.txt)//;
open(FILE,"$arg")||die "\nImpossible d'ouvrir le fichier\n";
&ouvre;
&entete;
&traitement;
&fin;
&ferme;


sub ouvre {
$FichierSortie= $arg . ".xml";
open(Sortie,">$FichierSortie");
}
# Entête de document XML
sub entete {
print Sortie "<?xml version=\"1.0\" encoding=\"iso-8859-1\" standalone=\"no\"?>\n<?xml-stylesheet type=\"text/xsl\" href=\"StyleC.xsl\"?>\n";
print Sortie "<document>\n<Nom>Aurélia Trinquier</Nom>\n";
}

sub traitement {

while ($Ligne = <FILE>)
{
# Remplacement des guillemets par <![CDATA["]]> (évite erreur d'interprétation XML)
$Ligne=~s/\"/<![CDATA[\"]]>/g;
$Ligne=~s/([^\t]*)\t([^\t]*)\t([^\n]*)\n/<element>\n <data type=\"mot\">$1<\/data>\n <data type=\"lemme\">$2<\/data>\n <data type=\"cat\">$3<\/data>\n<\/element>/;
print Sortie $Ligne;

}
}



# Fin de fichier
sub fin {
print Sortie "</document>\n";
}
# Fermeture des tampons
sub ferme {
close(Sortie);
close(FILEINPUT);
}