Bienvenue !

Ce projet a été réalisé dans le cadre du cours Programmation et projet encadré de M1 Traitement automatique des langues.

Les travaux présentés ici ont pour objectif de fournir des outils permettant l’extraction et le classement en rubriques d’informations contenues dans des fils RSS, l’annotation morphosyntaxique de ces informations, l’extraction de patrons, et la représentation de ces derniers sous forme de graphes.

D'ailleurs, pour cette année, on a aussi essayé de traiter le profondeur, c'est-à-dire le fichier en format txt avec le contenu détaillé.

Les fichiers traités sont issus d’une extraction automatique de fils RSS et de textes bruts à partir du site-web du quotidien Le Monde sur l’ensemble de l’année 2015 ( On a choisi la rubrique "À la une" ).

Membre du groupe

WANG Yizhe, Paris 3

Remerciement

J'aimerais remercier nos professeurs d'université pour les cours très enrichissants que nous avons suivi le long du semestre 2 : M. Fleury, M. Daube et M.Belmouhoub. Je remercie également l'ensemble de nos camarades de cours de Paris 3, Paris 10 et de l'Inalco qui se sont montrés motivés et solidaires autour de ce projet