Deuxième boite à outils
Avec cette deuxième boite à outils, nous allons étiqueter les fichiers précédemment obtenus avec les logiciels TreeTager et Cordial.
- Les fichiers .txt seront étiquetés via cordial. Les fichiers soumis à ce logiciel doivent être encodés en ISO.
- Les fichiers .xml seront enrichis par un étiquetage via TreeTagger à l'aide de la fonction etiquetage du programme précédent.
Fonction étiquetage par TreeTager
voici la fonction utilisée dans le programme en perl permettant d'étiqueter les fichiers via TreeTager :
Résultats
Voici les fichiers étiquetés pour la rubrique 3208 (actualité):
- Cliquer ici pour voir le document .txt contenant les titres étiquetés par TreeTager.
- Cliquer ici pour voir le document .txt contenant les descriptions étiquetés par TreeTager.
- Cliquer ici pour voir le document .xml contenant les titres étiquetés par TreeTager.
- Cliquer ici pour voir le document .xml contenant les descriptions étiquetés par TreeTager.
- Cliquer ici pour voir le fichier titre étiqueté par cordial.
- Cliquer ici pour voir le fichier description étiqueté par cordial.
Fichiers étiquetés pour la rubrique 3210 (international):
- Cliquer ici pour voir le document .txt contenant les titres étiquetés par TreeTager.
- Cliquer ici pour voir le document .txt contenant les descriptions étiquetés par TreeTager.
- Cliquer ici pour voir le document .xml contenant les titres étiquetés par TreeTager.
- Cliquer ici pour voir le document .xml contenant les descriptions étiquetés par TreeTager.
- Cliquer ici pour voir le fichier titre étiqueté par cordial.
- Cliquer ici pour voir le fichier description étiqueté par cordial.
