Partie 3
Textutils niveau0
Exercices sur le « Corpus Prématurés » (textutils niveau 0)
Textes de travail : index des mots du corpus prématurés

Ressources : http://tal.univ-paris3.fr/corpus/Prem-txt.zip

On trouvera dans l'archive précédente un fichier regroupant l'ensemble des mots du corpus (un par ligne).

Chaque ligne est construite de la manière suivante :

bébé_NMS

un mot est suivi de sa catégorie : la forme bébé Nom Masculin Singulier

  • Déterminer les différentes catégories présentes dans le corpus (leur nombre et leur fréquence)





Les catégories sont:
  • ADV
  • ADVNE
  • AFP
  • AFS
  • AMP
  • AMS
  • COCO
  • COSUB
  • DETMS
  • NFS
  • NMP
  • NMS
  • PDEMMS
  • PINDMS
  • PPER1S
  • PPER3FS
  • PPER3MS
  • PREFMP
  • PREFMS
  • PREP
  • PREPDES
  • V3S
  • VE3S
  • VPPFS
Pour chaque catégorie déterminer tous les mots associés.





























Pour les mots associés voici la commande de base, il suffira de remplacer "ADV" par les 24 autres motifs repérés (ADVNE,PREP...).