Boîtes à outils pour le traitement des fils de presse

Egle Ramdani  (Master TAL, Paris 3)

POINT DE DÉPART



Le point de départ est une arborescence qui contient des fils de presse (fichiers XML).



A partir de cette arborescence on crée un mini-corpus qui va avoir plusieurs états selon le traitement visé.