Série 2 : Etiquetage
Cordial
On soumet à Cordial un fichier texte contenant l'ensemble
des balises <description> (cf série 1).
On obtient cet étiquetage.
Grâce au programme ci-dessous on obtient un fichier
xml, qui après application d'une feuille de style
offre cette visualisation.
#!/usr/bin/perl
$arg = $ARGV[0];
$arg=~s/(.txt)//;
open(FILE,"$arg")||die "\nImpossible d'ouvrir le fichier\n";
&ouvre;
&entete;
&traitement;
&fin;
&ferme;
sub ouvre {
$FichierSortie= $arg . ".xml";
open(Sortie,">$FichierSortie");
}
# Entête de document XML
sub entete {
print Sortie "<?xml version=\"1.0\" encoding=\"iso-8859-1\"
standalone=\"no\"?>\n<?xml-stylesheet type=\"text/xsl\"
href=\"StyleC.xsl\"?>\n";
print Sortie
"<document>\n<Nom>Aurélia
Trinquier</Nom>\n";
}
sub traitement {
while ($Ligne = <FILE>)
{
# Remplacement des guillemets par <![CDATA["]]>
(évite erreur d'interprétation XML)
$Ligne=~s/\"/<![CDATA[\"]]>/g;
$Ligne=~s/([^\t]*)\t([^\t]*)\t([^\n]*)\n/<element>\n
<data type=\"mot\">$1<\/data>\n
<data type=\"lemme\">$2<\/data>\n
<data
type=\"cat\">$3<\/data>\n<\/element>/;
print Sortie $Ligne;
}
}
# Fin de fichier
sub fin {
print Sortie "</document>\n";
}
# Fermeture des tampons
sub ferme {
close(Sortie);
close(FILEINPUT);
}