Boîte à outils 4 | Retour |
Sommaire:
|
---|
À partir des suites de termes obtenues à l’aides des programmes de la boite à outils 3,
construire des graphes qui permettent une visualisation claire des relations entre
les termes,
cette représentation nous permet de tirer des conclusions sur le sens des mots
et les relations
entre ces mots. Mais avant d’utiliser les outils pour construire
des graphes, une présentation
de ce concept est indispensable.
Un graphe orienté est un graphe dont les arêtes sont orientées :
La representation Graphml:
<?xml version="1.0" encoding="iso-8859-1"?>
<graphml>
<key id="d0" for="node" attr.name="nom" attr.type="string"/>
<graph edgedefault="undirected">
<node id="1"><data key="d0">N1</data></node>
<node id="2"><data key="d0">N2</data></node>
<edge source="1" target="2"></edge>
<node id="3"><data key="d0">N3</data></node>
<edge source="1" target="3"></edge>
<node id="4"><data key="d0">N4</data></node>
<edge source="1" target="4"></edge>
<edge source="3" target="4"></edge>
<node id="5"><data key="d0">N5</data></node>
<edge source="3" target="5"></edge>
<edge source="2" target="3"></edge>
<edge source="2" target="5"></edge>
<edge source="4" target="5"></edge>
</graph>
</graphml>
*Vertices 5
1 "N1"
2 "N2"
3 "N3"
4 "N4"
5 "N5"
*Edges
1 2
1 3
1 4
3 4
3 5
2 3
2 5
4 5
On associe un graphe à la listes des termes de la boîte à outils 3:
À chaque mot correspond un nœud.
Deux mots génèrent une arête si ils apparaissent, au moins, une fois ensemble.
Le nombre de fois que les deux mots apparaissent ensemble représente le poids de l’arête.
a)Usage : perl patron2graphml.pl fichier_des_termes
b) Entrées : Le fichier de termes issus de la boîte à outils Série 3.c) Sortie : Un fichier graphml.
d) Source :Le programme commenté est disponible ici .
Pour générer le fichier pajek, on utilise la feuille de style fournie GraphML2Pajek.xsl.
On réalise cette opération à l’aide du processeur AltovaXSLT développé par Altova. (telecharger)
Le programme patron2graphml.pl est appelé pour produire le fichier graphml, immédiatement
À partir de la liste de termes gnerée par le programme trouve_Treetagger.pl de la boite à outil 3,
on obtient le fichier graphml.
À l’aide de la feuille de style et d’AltovaXSLT on crée le fichier pajek
Le fichier étiqueté fourni (taille 2 mo), produit le graphe:
Le graphe généré par la liste des termes obtenue en utilisant Cordial :