Boîte à outils 2 : Etiquetage d'un texte (suite)

Cette ligne stocke temporairement le fichier étiqueté en format texte. Mais ce qu’on veut en sortie, c’est un fichier XML. D’où l’utilisation du programme , ce qui explique l’insertion ce la ligne suivante :

system("perl ./treetagger-win32/cmd/treetagger2xml.pl tmp-resultat-etiquetage.txt");

Le script final est consultable ici.

Résultat avec Treetagger

Ci-dessous un extrait du fichier de sortie, au format XML, que nous avons nommé SORTIE-etiquetage-treetagger.xml.

précédent<<suivant>>