Exercice
19.21 (étape 1 et étape 2) :
19.21
Exercices sur le "Corpus Prématurés" (niveau 2) :
Outils
: Emacs, commandes TextUtils, Cordial, MkCorpus…
Textes
de travail : p96.tab, p96.tag
- Etape
1 : Un index des adjectifs
- Construire un index de tous les adjectifs
présents dans le corpus (outils utilisables : emacs,
commandes unix (sort, grep)).
Partons du fichier de base, on fait une macro pour relever uniquement les adjectifs dans le corpus
adjectifs_du_corpus + macro
On enlève ensuite l'étiquettage lié à ces adjectifs
adjectifs sans étiquette + macro
On trie ensuite ces adjectifs sous cygwin :
et on les place dans un fichier qu'on appelle adjtrie.txt
nous comptons ensuite le nombre d'ajectifs ,une fois triés (avec une seule occurence). On en compte 119.
On trouve alors nos adjectifs dans le fichier
adjectifs-tries
Après avoir choisi 5 adjectifs de cet index :
Nous avons choisi les adjectifs
suivants: aréactif, éléctrique, gigoteur,
gastrique et sédaté .
- extraire les zones textuelles contenant les adjectifs choisis et le numéro de l'infirmière associée puis extraire le premier mot des zones textuelles
précédentes, les classer par infirmière, en faire
le tri et les compter
Pour le numéro de l'infirmiere, on va sous cygwin, avec la commande cut on tape : cut -f2,4,14 p96.tab