Exercices sur le « Corpus Prématurés » (niveau 0)
    * Déterminer les différentes catégories présentes dans le corpus (leur nombre et leur fréquence)
 
J’ai tout d’abord créé une liste des differentes catégories avec une macro Emacs :
liste_cat.txt
 
Ensuite, je suis passée dans le terminal pour ne garder qu’une occurrence de chaque des catégories, dans une nouvelle liste :
liste_cat2.txt
 
Avec la ligne de commande « wc -l liste-cat2.txt », je peux voir combien il y a de catégories différentes en tout.
 
    * Pour chaque catégorie déterminer tous les mots associés.
 
ADV, ADVNE, ADVPAS :
 
AFP :
« 1 match for "AFP" in buffer: liste-mots.txt
     64:sympa_AFP »
 
AFS :
 
AMP :
« 1 match for "AMP" in buffer: liste-mots.txt
    194:réceptif_AMP »
 
-   AMS :
 
COCO :
1 match for "COCO" in buffer: liste-mots.txt
     10:mais_COCO
 
COSUB :
1 match for "COSUB" in buffer: liste-mots.txt
      8:lorsque_COSUB
 
DETMS :
2 matches for "DETMS" in buffer: liste-mots.txt
     22:un_DETMS
    176:un_DETMS
 
NFS :
 
NMP :
1 match for "NMP" in buffer: liste-mots.txt
    132:traits_NMP
 
NMS :
 
PDEMMS :
4 matches for "PDEMMS" in buffer: liste-mots.txt
      6:c'_PDEMMS
     87:c'_PDEMMS
     89:c'_PDEMMS
    125:c'_PDEMMS
 
 
PINDMS :
1 match for "PINDMS" in buffer: liste-mots.txt
    233:tout_PINDMS
 
PPER1S :
1 match for "PPER1S" in buffer: liste-mots.txt
     84:je_PPER1S
 
PPER3FS :
3 matches for "PPER3FS" in buffer: liste-mots.txt
      7:elle_PPER3FS
    107:elle_PPER3FS
    124:elle_PPER3FS
 
 
PPER3MS :
1 match for "PPER3MS" in buffer: liste-mots.txt
     75:il_PPER3MS
 
PREFMP :
1 match for "PREFMP" in buffer: liste-mots.txt
     59:se_PREFMP
 
PREFMS :
 
PREP :
5 matches for "PREP" in buffer: liste-mots.txt
    135:avant_PREP
    136:après_PREP
    137:malgré_PREP
    162:par_PREP
    172:des_PREPDES
 
PREPDES :
1 match for "PREPDES" in buffer: liste-mots.txt
    172:des_PREPDES
 
V3S :
 
VE3S :
1 match for "VE3S" in buffer: liste-mots.txt
    160:est_VE3S
 
VPPFS :
4 matches for "VPPFS" in buffer: liste-mots.txt
      9:détendue_VPPFS
     44:endormie_VPPFS
     51:détendue_VPPFS
     57:détendue_VPPFS