Transformation des textes aux graphes avec Pajek
A partir des fichiers obtenus dans la boîte à outils 3 (liste_Patron_treetagger.txt et liste_Patron_cordial.txt), et à l'aide d'un script Perl (patron2graphml.pl) nous avons créé des fichiers GraphML au format XML qui définissent les liens entre les mots associés dans les listes des patrons, à travers deux balises essentielles :<node> défini les noeuds (qui sont les mots) et <edge> défini les arcs : lien entre deux mots.
La syntaxe d'utilisation: perl patron2graphml.pl liste_Patron_treetagger.txt
perl patron2graphml.pl liste_Patron_cordial.txt
Les fichiers obtenus ( patron-graphml_tagger.xml et patron-graphml_cordial.xml )
En utilisant une feuille de styles ( GraphML2Pajek.xsl ) avec les deux fichiers obtenus précédemment, on obtient deux fichiers au format TXT( entree-pajek-tagger.txt et entree-pajek-cordial.txt ) prêts à être utilisés comme entrée de Pajek.
Les deux graphes obtenus avec Pajek:
- Pour treetagger:
Pour Cordial: