Programmation et projet encadré

Le projet "Boîte à Outils" a été réalisé dans le cadre du cours: Programmation et Projet Encadré pour la session 2008-2009.

Sous la supervision des enseignants: Messieurs S.FLEURY, J.M.DAUBE et R.BELMOUHOUB

Objectif :

Il s'agit de créer une chaîne de traitements textuels semi-automatique à l'aide de quelques outils:

Treetagger, Cordial, Pajek, script perl et au langage XML.

Cette chaîne prend, en entrée, une arborescence contenant des fichiers de fils RSS issus

du site "lemonde.fr" et donne, en sortie, des fichiers de différents formats contenant

chacun l'ensemble du corpus.

Corpus de travail :

-Fils RSS du journal Le Monde;

-17 fils RSS archivés une fois par jour à 19h00 sur plusieurs semaines.

Les fils RSS sont des flux de contenus gratuits en provenance de sites Internet.

Ils incluent les titres des articles, des résumés et des liens vers les articles intégraux à consulter en ligne.

Liste des fils RSS du journal

http://www.lemonde.fr/web/rss/0,48-0,1-0,0.html



FOUTOUN CHAAR © 2009.Tout droit réservés.