ANGLICISME

La vie multilingue des mots sur le web

Nuages de mots

Un nuage de mots est une représentation visuelle des mots les plus fréquents d'un texte. Les mots sont organisés sous la forme d'un nuage, et leur taille varie en fonction de leur occurrence : plus un mot est fréquent, plus il apparaît grand dans le nuage.

Les nuages de mots nous permettent, de part leur représentation visuelle sympathique, d'identifier rapidement les mots clés de nos corpus.

Il existe beaucoup de générateurs de nuages de mots en ligne. Notre choix s'est porté sur WordItOut. Le nuage de mots est créé à partir d'un texte, et d'une liste de stop words. Il est également possible de choisir la police et les couleurs.

Nous avons créé trois nuages, un pour chacune de nos langues de travail. Pour cela, nous avons donné en entrée le contenu de nos fichiers contextes concaténés. Pour éliminer les mots vides, nous avons également utilisé une liste de stopwords trouvée en ligne, que nous avons complétée manuellement.

En observant les nuages générés, on remarque que les principaux mots clés des corpus sont communs dans les trois langues :

anglicisme anglicismi الدخيل
langue lingua اللغة
anglais inglese انجليزية
français italiano العربية

Nuages de mots obtenus :

Français
image nuage français

Italien
image nuage italien

Arabe
image nuage arabe