Transformation des textes aux graphes avec Pajek

 

A partir des fichiers obtenus dans la boîte à outils 3 (liste_Patron_treetagger.txt et liste_Patron_cordial.txt),  et à l'aide d'un script Perl (patron2graphml.pl) nous avons créé des fichiers  GraphML au format XML qui définissent les liens entre les  mots associés dans  les listes des patrons, à travers deux balises essentielles :<node> défini les noeuds (qui sont les mots) et <edge> défini les arcs : lien entre deux mots.

La syntaxe d'utilisation: perl patron2graphml.pl   liste_Patron_treetagger.txt

                                               perl patron2graphml.pl  liste_Patron_cordial.txt

Les fichiers obtenus ( patron-graphml_tagger.xml et patron-graphml_cordial.xml )

En utilisant une feuille de styles ( GraphML2Pajek.xsl ) avec les deux fichiers obtenus précédemment, on obtient deux fichiers au format TXT( entree-pajek-tagger.txt  et  entree-pajek-cordial.txt ) prêts à être utilisés comme entrée de Pajek. 

Les deux graphes obtenus avec Pajek:

- Pour treetagger:

 

Pour Cordial: