Boite à outils 4 : création de graphes

Objectif

Le but de cette boite à outils est de créer des graphes à partir des patrons que l'on a extrait dans la boite à outils 3. On travail sur les fichiers de sorties Cordial et XSL. Pour celà, on écrit un script qui convertira les fichiers textes en fichiers .net. De cette façon, on pourra créer notre graphe en utilisant le logiciel Pajex.

Ici nous ne travaillerons que sur les sorties Cordial de "A la une", le traitement étant ensuite exactement le même pour les sorties XSL ainsi que pour les autrs rubriques.


Le script

Dans notre script, on commence par appeller le programme patron2graphml.pl qui prend notre premier fichier à convertir en entrée. Ce programme a pour fonction d'associer entre eux les mots qui apparaissent ensemble.
Puis, toujours sur ce même fichier, on lance Altova (par l'intermediaire de Cygwin) qui va nous permettre de convertir le fichier en une sortie acceptable par Pajex. Pour cela on utilise la feuille de style GraphML2Pajek.xsl qui définie la structure du fichier de sortie.

Pour télécharger le script final : script-bao4.pl. A noter que le script ne traite que les sorties Cordial de "A la une". Il faudrait le compléter pour pouvoir créer des graphes sur toutes les rubriques.

Voici un exemple de fichier de sortie que l'on obtient : A_la_une1.net


haut de page

Création du graphe

Il s'agit maintenant d'ouvrir le fichier que l'on vient d'obtenir avec Pajex.


Puis on dessine le graphe


Et obtient quelque chose qui ressemble à ça :


Voyons ce que ça donne de plus près, et en "3D". (Cliquez sur l'image pour l'agrandir.)

On réalise ensuite le même traitement sur tous les fichiers.

 

 

haut de page