Nuages de mots
Après avoir concaténé tous les fichiers "contexte" et "dump" par langue, il est possible de représenter graphiquement les mots les plus fréquents des corpus sous forme de nuages de mots réalisés avec des applications en ligne (WordItOut et Wordle).
Chaque application a ses particularités et s'adapte plus ou moins bien au script de la langue.
Wordle, par exemple, offre plus de paramètres esthétiques (position des mots, angles, formes) mais n’est pas bien adapté aux glyphes de l’alphabet ourdou : certaines ligatures s’affichent mal. Word It Out a de son côté l’avantage de permettre la sélection des mots à ne pas prendre en compte dans le nuage : on peut ainsi retirer tous les mots outils comme les postpositions ou les auxiliaires.



Et voici le résultat avec l'application Word It Out :

