Accueil Boîte à outil 1 Boîte à outil 2 Boîte à outil 3 Boîte à outil 4

Boîte à outil 2

Utilisation de l'étiqueteur Tree Tagger

Après avoir filtré le répertoire et nettoyé les fichiers, on souhaite à présent analyser les textes à l'aide du Tree Tagger. Cet outil morphosyntaxique permet d'associer à chaque mot son type et son lemme. Cependant, on doit modifier le précédent script car Tree Tagger n'étant pas une commande de Perl, il faut le rappeler avec la commande system. Enfin, Tree Tagger ne prennant en entrée que des fichiers textes contenant un mot par ligne, on doit encore adapter le programme et on obtient un nouveau script. On peut visualiser le résultat sous forme de fichier XML ou voir directement la page web obtenue grâce à une feuille de style .xsl.

Utilisation de l'étiqueteur Cordial

Ce deuxième outil permet aussi d'étiqueter les mots d'un texte. Son utilisation est différente de celle de Tree Tagger. On doit se servir de l'interface du logiciel Cordial pour étiqueter un fichier texte normal obtenu grâce à ce script Perl. Après avoir choisi les options dans l'onglet syntaxe puis Etiquetage du texte, on obtient en sortie un fichier texte où chaque mot est analysé. On peut aussi obtenir une sortie web, grâce à une feuille de style obtenue par ce programme Perl.