Nuages de mots

Après avoir concaténé tous les fichiers "contexte" et "dump" par langue, il est possible de représenter graphiquement les mots les plus fréquents des corpus sous forme de nuages de mots réalisés avec des applications en ligne (WordItOut et Wordle).
Chaque application a ses particularités et s'adapte plus ou moins bien au script de la langue. Wordle, par exemple, offre plus de paramètres esthétiques (position des mots, angles, formes) mais n’est pas bien adapté aux glyphes de l’alphabet ourdou : certaines ligatures s’affichent mal. Word It Out a de son côté l’avantage de permettre la sélection des mots à ne pas prendre en compte dans le nuage : on peut ainsi retirer tous les mots outils comme les postpositions ou les auxiliaires.

nuage de mots en français
Nuage de mots en français à partir des fichiers « contextes » concaténés.
nuage de mots en français
Nuage de mots en ourdou à partir des fichiers « contextes » concaténés.
nuage de mots en français
Nuage de mots en pendjabi à partir des fichiers « contextes » concaténés.

Et voici le résultat avec l'application Word It Out :

nuage de mots en français
Nuage de mots en ourdou à partir des fichiers « contextes » concaténés.
nuage de mots en français
Nuage de mots en pendjabi à partir des fichiers « contextes » concaténés.

Retourner en haut de la page

flèche retour haut de page