Bienvenue sur mon site !
Ce site est réalisé dans le cadre du cours «Programmation Projet encadré» du Master1 «PluriTAL » (Paris III, INALCO, Paris X) dans le but d'implémenter une chaîne de traitement textuel semi-automatique, depuis la récupération des données jusqu'à leur présentation. Le projet précédent, présentant des ambiguïtés lexicales engendrées par des formes de polysémie, a fait appel aux méthodes et applications informatiques nécessaires pour atteindre plusieurs objectifs tels que le recouvrement de corpus, la recherche d'information, la récupération d'un texte brut avec des commandes.. Ce projet, alliant tout ces objectifs à la maîtrise des nouveaux outils informatiques, vise à nous amener à acquérir les bases essentielles de normalisation des textes, de segmentation, d'étiquetage morphosyntaxique, d'extraction des contenus textuels dans des fils RSS ... Le traitement réalisé peut être découpé en quatre boîtes à outils.