Le but de ce projet est de manipuler certains outils nécessaires pour le traitement des données textuelles. Le point d'entrée est une arborescence de fils RSS (Voir exemple), du journal Le Monde du 20/11/2006 au 21/12/2006, sur laquelle on réalise une série de traitements semi-automatique à l'aide de quelques outils (Scripts Perl, XML, Treetagger, Cordial et Pajek), pour obtenir à la fin des traitements des graphes de mots qui s'attirent.

Schéma du travail