Nuages D'arbres

On remarque dans les nuages d'arbres qu'il y a beaucoup de déterminants : "de","la","et","al","en","el","a","o".. C'est normal puisqu'ils permettent de représenter les 50 mots les plus présents dans les dumps des sites soumis. Il est bien évident que les déterminants sont des éléments qui reviennent très souvent dans tout texte. Bien qu'il reste un peu de "bruits" pour certains graphes, on arrive tout de même à distinguer des ramifications ou clusters de mots qui s'assemblent dans les sens choisis. On voit tout naturellement par exemple, que les mots "informatico", "informatica" et "trabajo" sont dans le même cluster, dans le sens "environnement informatique" pour l'espagnol. De plus, les mots qui ressortent le plus sont "informatico" et "ambiente".

Donc ces graphes nous donnent une représentation tout à fait exacte des 50 mots les plus fréquents. La possibilité de voir les rapprochements de mots les plus fréquents nous indique les différents thèmes associés aux sens choisis. Après étude de chaque graphe, on peut en tirer la conclusion que pour tous les sens choisis et par rapport aux sites soumis, on reste dans des thèmes très proches du sens en question, on ne s'en écarte que rarement. On remarque encore une fois que pour le sens "environnement socio-culturel", les mots qui ressortent ont en effet attrait à l'aspect social et culturel, mais on ne voit pas ressortir très souvent les mots de la définition en question, "environnement" et "socio-culturel".

Environnement Informatique

Espagnol

Français

Portugais


Environnement Linguistique

Espagnol

Français

Portugais



Environnement Naturel

Espagnol

Français

Portugais



Environnement Socio-Culturel

Espagnol

Français

Portugais