Exercice 4(Exercices sur le « Corpus Prématurés » (niveau 1))

Cet exercice comporte deux étapes :


  1. Etape 1 : un index des adjectifs

  2. Essayer de construire un index de tous les adjectifs présents dans le corpus. (Outils disponibles : commandes TextUtils)


    Ce travail peut être fait en plusieurs étapes :


    Dans une première commande on peut commencer par filtrer les adjectifs dans p96.tag et subsituer dans le résultat les blancs par un dièse et les slash par un underscore pour obtenir des lignes du type :
    §très_ADV#bon_AMS#contact_NMS#._YPFOR#
    § commandes utilisées : egrep, tr


    on pourra ensuite projeter les pseudos colonnes et ne garder que les lignes qui contiennent les adjectifs
    § commandes utilisées : cut, egrep


    On concatènera l’ensemble des adjectifs trouvés avant de les trier…
    § commandes utilisées : cat, sort


    pour aller sur cet exercice cliquez ici


  3. Etape 2 : filtrages

  4. Après avoir choisi 5 adjectifs de cet index :


    extraire les zones textuelles contenant les adjectifs choisis et le numéro de l'infirmière associée


    extraire le premier mot des zones textuelles précédentes, les classer par infirmière, en faire le tri et les compter


    pour aller sur cet exercice cliquez ici