Outils Utilisés pour la Récupération des Thèmes

 

Les Logiciels utiles pour réaliser cette étude sont Lexico 3 et Le trameur. L'utilisation de ces deux logiciels nous a donné des résultats complémentaires.
Lexico 3 nous permettant de trouver les mots à étudier (voir la rubrique choix des mots) mais aussi de comprendre les thèmes présentés par Le Trameur dans la recherche de poly-cooccurrence.

 

Lexico 3

Lexico3 est réalisé par l’équipe universitaire du SYLED-CLA2T.

Après avoir récupéré les mots à étudier, nous pouvons grâce à l'option goupe de formes connaître le nombre d'occurrences de chaque mot de la liste.

Après avoir choisi un mot, et l'avoir placé dans la carte des sections (voir l'image suivante), l'utilisation de l'icône de spécificité par section, on peut connaître les cooccurrents principaux du mot choisi. A partir de ce moment, on passe sous le logiciel Le Trameur afin de faire une des poly-occurrents du mot choisi.

Connaître les spécificités va nous servir à vérifier que l'on a les bons cooccurrents avec Le Trameur, et donc à affiner notre recherche de cooccurrents pour le cas où le seuil serait trop haut.


Le Trameur

Le Trameur est un programme de génération puis de gestion de la trame et du cadre d'un texte. Le but de "Le Trameur" est de construire des opérations lexicométriques. Il intègre le programme treetagger, qui est un système d'étiquetage automatique des catégories grammaticales des mots avec lemmatisation

Le Trameur va nous permettre de récupérer les thèmes donnés par les poly-occurrents. A travers l'onglet COOCs.

Après avoir chargé le pôle à étudier :

On clique sur le bouton placé sous Cooccurrences afin de calculer les cooccurrents du pôle.

Dans le cas où le nombre de cooccurrents serait trop bas, on relance l'opération en baissant le seuil de recherche. De plus, certain mots, notamment des articles, apparaissent avec une fréquence très élevée dans le résultat de la recherche. Pour les éviter, on peut soit charger une stopliste, soit la créer au fur et à mesure. On ne serait que trop conseiller quand on ajoute un mot dans la stopliste de relancer la recherche de manière à ne pas perdre de temps lors de la recherche de poly-occurrent.

On peut alors vérifier que les cooccurrents donnés par Lexico 3 correspondent.

Pour la suite, on clique sur poly-occurrences, et là, il faut prévoir autre chose à faire au vu du temps de traitement...

Les résultats sont donnés sous la forme d 'un graph. Voici ce que cela donne après ré-organisation :

De ce graphe, on récupère les différents thèmes liés au pôle. Dans le graphe ci-dessus, la première ligne parle des attentats terroristes de l'ETA en Espagne et de la réaction du chef du gouvernement et appartient à la catégorie Politique. Dans le cas où le thème n'apparaît pas de prime abord, on peut rechercher dans la carte des sections de Lexico 3 la phrase regroupant les cooccurrents afin de déterminer le thème. Mais cela n'est pas valable si le pôle a trop d'occurrence.

 

Haut de page