La boîte à graphe - partie 4

Dans un premier temps, pour chaque partie on lance le programme patron2graphml.pl donné au départ avec comme argument 0 le nom du fichier contenant les extractions des patrons et comme argument 1 le fichier contenant les patrons (cf. la boite à outil 3). Ce programme crée un fichier xml.

On ouvre ce fichier xml avec le logiciel Cooktop, ainsi que la feuille de style xsl donné au départ et enfin on clique sur Run afin d'obtenir un fichier contenant les informations nécessaires pour l'élaboration d'un graphe avec le logiciel Pajek.

Pour TreeTagger, le fichier xml est celui-ci et le fichier obtenu avec la commande Run est celui-ci.

Pour Cordial, le premier fichier xml fut obtenu avec le fichier patron Non Adjectif, le fichier texte obtenu est ici. Le fichier patron Nom Verbe a permis l'obtention de ce fichier xml; et la commande Run de ce fichier texte.


Dans un second temps, les fichiers textes obtenus avec la commande Run sous Cooktop ont été ouvert un par un avec le logiciel Pajek et ont permis d'obtenir les graphes suivants :

        - le graphe du patron Nom Adjectif de l'étiquetage TreeTagger.

        - le graphe du patron Nom Adjectif de l'étiquetage Cordial

On constate que malgré qu'il ait le même patron, c'est-à-dire Nom Adjectif. Les deux graphes sont différents. En effet, les deux logiciels Cordial et TreeTagger ont tous deux des façons d'étiqueter différentes. Par exemple, TreeTagger étiquette "sentiment" comme étant un nom et "d" comme un adjectif. Tandis que Cordial étiquette "sentiment" comme un nom et "d' " comme une préposition. Cette différence d'étiquetage était déjà présente dans les boîtes précédentes mais lors de la création de graphes, cette différence est plus visible et elle permet d'expliquer pourquoi ces deux graphes qui ont pourtant un même patron syntaxique sont différents.

         - le graphe du patron Nom Verbe conjugué de l'étiquetage Cordial