bag



BàO 4: des Textes aux Graphes




L'objectif de cette dernière boîte à outils est d'obtenir, à partir des patrons syntaxiques extraits, des graphes permettant de visualiser de façon plus lisible et structurée les informations.

Pour cela, nous utilisons l'application patron2graphe.exe qui est extraite du Trameur. Ce programme permet de produire des graphes de mots.


La commande prend pour premier argument le codage des caractères d'un fichier, qui constitue le deuxième argument: un fichier de patrons obtenu avec BàO3. 


Le troisième argument qui est optionnel concerne le fichier contenant le motif à rechercher pour filtrer les patrons. Il contient une seule ligne qui commence par la chaîne de caractères "MOTIF", suivi du motif, qui sera "paix" dans notre analyse. 

Les fichiers obtenus via la méthode Cordial dans la BàO3 sont encodés en iso-8859-1, alors que les fichiers obtenus via la méthode TreeTagger sont encodés en utf-8. Il faut pour cela utiliser des fichiers de motifs pour les deux encodages.


dossier patron2graphe.exe     à télécharger


Graphe (Cordial)






Graphe (Treetagger)






Comparaison des graphes


On constate que certains termes ne se retrouvent que dans le graphe généré par la méthode Cordial comme "en" et "2009".
A l'inverse des termes comme "Nations" ou "dissident" n'apparaissent que dans le graphe généré par la méthode TreeTagger.

Les fichiers générés dans la BàO3 semblent donc être différents selon la méthode suivie.
Toutefois, les deux méthodes semblent assez performantes pour effectuer ce traitement.
Bascarane Lydia & Dubremetz Marie - © 2011