Accueil


Boîte à outils 1


Boîte à outils 2


Boîte à outils 3


Boîte à outils 4


Boîte à outils et le Trameur









© 2008 | Tatiana   MAKOUSKAYA et
 Lionel SHEN (INaLCO)



Boîte à outils

Boîte à outils 2
   


La Boîte à outils 2 consiste à étiqueter les contenus textuels des balises <description>avec Tree-Tagger et Cordial.

Ressources
Une arborescence de fils RSS
tokenise-fr.pl : programme pour découper un texte en mots
treetagger2xml.pl : programme permettant de convertir les données en sortie de TreeTagger au format XML






Etiquetage  avec Tree-tagger

Avec Tree-Tagger, c'est simple : il suffit de l'appeler dans le programme à l'aide du script ici.



Résultat de l'étiquetage avec Tree-Tagger en XML.



Tout les résultats.





Etiquetage  avec Cordial

Notez que Cordial ne veut que du fichier texte.
Pour appliquer Cordial, le paramétrage de l'étiquetage doit être comme ceci.

Il faut les traiter un par un.

Résultat de l'étiquetage avec Cordial en .txt(à la une).