BAO4

Génération de graphes

Dans la BAO 4, nous avons généré des graphes pour mettre en valeur les résultats que nous avons obtenus dans la BAO 2 et 3. Pour ce faire, nous avons généré, dans un premier temps, des graphes généraux (cf. infra, 2- Graphes générés à partir de la sortie de Treetagger ; 3- Graphes générés à partir de la sortie de Cordial).
Dans un second temps, nous avons utilisé des motifs et des graphes généraux pour mettre en valeur certaines erreurs d'étiquetage dans les sorties de Treetagger et de Cordial (cf. infra, 4- Quelques erreurs d'étiquetage). Ceci nous permettra de mettre en valeur les forces et les faiblesses de chaque étiqueteur.


Avant de présenter nos graphes, nous allons voir comment fonctionne le programme patron2graphe.exe


1- Patron2graphe


Patron2graphe.exe est un programme qui est extrait du Trameur. Ce programme permet de générer des graphes. La ligne de commande à saisir est la suivante :

patrons2graphe.exe "encodage" fichier-de-patrons.txt motif.txt

L'utilisation d'un motif n'est pas obligatoire. En effet, un motif permet de filtrer les patrons pour ne garder que ceux qui sont pertinents. Pour utiliser un motif, il faut crée un fichier au format texte et écrire cette ligne :
Motif=motif (e.g., Motif=exposition).


2- Graphes générés à partir de la sortie de Treetagger


Le patron NOM ADJ


image

Cliquez sur l'image pour l'agrandir




haut de page


Le patron NOM PREP NOM


image

Cliquez sur l'image pour l'agrandir



Ce graphe permet de mettre en valeur le nombre important de patrons NOM PREP NOM qui ont été extraits à partir de la sortie de Treetagger.


3- Graphes générés à partir de la sortie de Cordial


Le patron NOM ADJ


image

Cliquez sur l'image pour l'agrandir




haut de page


Le patron NOM PREP NOM


image

Cliquez sur l'image pour l'agrandir




4- Quelques erreurs d'étiquetage


L'interprétation de deux noms comme un patron NOM ADJ


image

Cliquez sur l'image pour l'agrandir



Ce graphe montre que Treetagger interprète l'apposition de deux noms comme un patron NOM ADJ.
Nous avons utilisé le motif "site".


haut de page


L'attirance entre le prénom et le nom


image

Cliquez sur l'image pour l'agrandir



Ce graphe montre que Treetagger interprète un prénom suivi d'un nom comme un patron NOM ADJ. Nous pouvons constater, néanmoins, l'attirance qui réside entre un prénom et un nom. Rappelons que cette attirance est issue d'un étiquetage erroné.


L'étiquetage de "du"


image

Cliquez sur l'image pour l'agrandir



On constate, à la lumière de ce graphe, que Treetagger reconnaît "du" comme une préposition, ce qui n'est pas le cas pour Cordial, qui l'étiquette comme un déterminant, d'où l'absence de ce type de patron NOM PREP NOM lorsque nous avons utilisé la sortie étiquetée avec Cordial.
Nous avons utlisé le motif "du".


haut de page


Le patron "vie commune"


image

Cliquez sur l'image pour l'agrandir



On constate, à la lumière de ce graphe, que Cordial reconnaît "vie commune" comme un patron NOM ADJ, ce qui n'est pas le cas pour Treetagger qui l'étiquette comme une suite de deux noms.
Nous avons utlisé le motif "vie".


Le patron exposition L'


image

Cliquez sur l'image pour l'agrandir



Ce graphe met en valeur une erreur d'étiquetage. En effet, Cordial reconnaît L' comme un adjectif.
Nous avons utlisé le motif "exposition".


haut de page


D'autres erreurs d'étiquetage dans la sortie de Cordial


image

Cliquez sur l'image pour l'agrandir



Ce graphe met en valeur certains patrons NOM ADJ, qui sont le résultat d'un étiquetage erroné dans la sortie de Cordial. Ces erreurs ont déjà été évoquées dans la (BAO3).


Un patron NOM PREP NOM incorrect issu d'une erreur d'orthographe


image

Cliquez sur l'image pour l'agrandir



Ce graphe montre l'extraction du patron NOM PREP NOM "Evoqué par Nicolas", qui est le résultat d'une erreur d'orthographe selon l'étiquetage de Cordial.


haut de page