PARTIE 3 (egrep)

Utilisation TextUtils

Niveau 1

Outils : commandes TextUtils
Textes de travail : p96.tab et p96.tag

Etape 1: un index des adjectifs

Essayer de construire un index de tous les adjectifs présents dans le corpus. (Outils disponibles : commandes TextUtils)

Ce travail peut être fait en plusieurs étapes :

- Dans une première commande on peut commencer par filtrer les adjectifs dans p96.tag et subsituer dans le résultat les blancs par un dièse et les slash par un underscore pour obtenir des lignes du type :
     ¤ très_ADV#bon_AMS#contact_NMS#._YPFOR#
     ¤ Commandes utilisées : egrep, tr

- On pourra ensuite projeter les pseudos colonnes et ne garder que les lignes qui contiennent les adjectifs
     ¤ Commandes utilisées : cut, egrep

- On concatènera l’ensemble des adjectifs trouvés avant de les trier…
     ¤ Commandes utilisées : cat, sort

Fichier p96.tag

Fichier (fichier de sortie)

Projections d'une colonne ne contenant que les adjectifs.

Adjectifs (fichier de sortie)

Subsitution dans le résultat des blancs par un dièse et les slash par un underscore

Ensemble des adjectifs triés par ordre alphabétique.

Index des Adjectifs (fichier de sortie)


Etape 2: filtrages

Après avoir choisi 5 adjectifs de cet index :

- Extraire les zones textuelles contenant les adjectifs choisis et le numéro de l'infirmière associée

- Extraire le premier mot des zones textuelles précédentes, les classer par infirmière, en faire le tri et les compter

Voici les 5 adjectifs choisis : adorable, marrant, tonique, timide, calme.

Extraction des zones textuelles contentant les adjectifs choisis ainsi que le numéro de l'infirmière associée.

Adjectif : adorable (fichier de sortie)

Adjectif : marrant (fichier de sortie)

Adjectif : tonique (fichier de sortie)

Adjectif : timide (fichier de sortie)

Adjectif : calme (fichier de sortie)

Extraction du premier mot des zones textuelles précédentes

Pour l'adjectif "adorable" :
Petite / Regarde

Pour l'adjectif "marrant" :
Bébé

Pour l'adjectif "tonique" :
Bon / Bébé / Bété / C'est / Hypotonique / Malgré / Nerveux / Ouvre / Petit / Petite / Très

Pour l'adjectif "timide" :
Enfant

Pour l'adjectif "calme" :
Bébé / Bété / Dort / Détendue / Endormie / Enfant / Petit / Recherche / Tonique / Tranquille / Très

Retourner en haut de la page

  Précédent                                                                                                             Suivant