PRÉAMBULE : PRÉSENTATION DU CORPUS PRÉMATURÉS 96



MOTIVATIONS
Ce travail a pour but la manipulation de données textuelles grâce à l'utillisation des expressions régulières sous WORD et EMACS, ainsi que l'outil de filtrage "egrep" sous une interface Unix.


LES ÉTATS DU CORPUS PRÉMATURÉS
Il existe plusieurs versions du corpus: les versions brutes (p96.tab,p96.bal et p96.fic) qui sont des versions au format txt; et les versions html qui sont présentes sur le site de l'ILPGA: http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/corpus/Prem/index.html


LES DIFFÉRENTS THÈMES DE TRAVAIL
Tous les exercices demandés ont été réalisés en plusieurs étapes:
  1. Navigation dans le corpus

  2. Word et expressions régulières

  3. Emacs

  4. Commandes sous Unix