Laurie Acensio-Kun Jin

Année 2009-2010

Boîte à outils

Exploitation linguistique du web

Projet BAO

Notre projet consiste à extraire d'un corpus de fils RSS du journal "Le Monde" une rubrique particulière pour aboutir à des patrons syntaxiques sous formes de graphes de mots.

Elle se décompose en quatre étapes principales du filtrage du corpus jusqu'à l'extraction de patrons.

Le point de départ du projet est la rubrique "Politique" du journal Le Monde.