Partie 3

Exercices sur le «Corpus Pématurés» avec emacs

Dans cette partie, on utilisera le menu de recherche de chaînes de caractères pour réaliser les opérations suivantes :

Rechercher les fiches contenant une interrogation

Rechercher les fiches pour lesquelles le score médical est de 12

Faire de même pour un score de 10.

Rechercher les fiches du jour 0 pour lesquels le bébé est né à 28 semaines

Exercices sur le «Corpus Prématurés» avec egrep

Dans cette partie, on doit obtenir en sortie un fichier pour chaque requête demandée.

Extraire les fiches contenant une interrogation

Extraire les fiches correspondant au bébé 12

Extraire les fiches correspondant au bébé 1

Extraire les fiches pour lesquelles le score médical est de 12

Faire de même pour un score de 10.

Quelles sont les fiches qui vont être extraites si l'on recherche les fiches commençant par 13 ? Expliquer ?

Extraire les fiches correspondant aux bébés faisant au moins 1000 grammes.

Dans cette partie, on doit obtenir en sortie un fichier pour chaque requête demandée.

Extraire les fiches concernant les bébés 10 à 12

Extraire les fiches concernant les bébés 10 et 12, c'est-a-dire sans 11 et 13

Trouver le nombre de bébés de 23, ..., 30 semaines

Extraire les fiches du jour 0 pour lesquels le bébé est né à 28 semaines

Extraire les fiches des bébés nés entre 23 et 29 semaines

Extraire les fiches pour lesquels le bébé à la naissance faisait au m oins 1000 grammes

Extraire les fiches pour lesquels le bébé à la naissance faisait moins de 1000 grammes

Extraire les fiches rédigées par les infirmières 12 et 22

Extraire les fiches concernant le bébé 10 et ne correspondant pas au jour 0

Exercices sur le «Corpus Prématurés» (niveau 1)

Etape 1 : un index des adjectifs

Essayer de construire un index de tous les adjectifs présents dans le corpus. (Outils disponibles : commandes TextUtils)

Ce travail peut être fait en plusieurs étapes :

Dans une première commande on peut commencer par filtrer les adjectifs dans p96.tag et subsituer dans le résultat les blancs par un dièse et les slash par un underscore pour obtenir des lignes du type :

très_ADV#bon_AMS#contact_NMS#._YPFOR#

Commandes utilisées : egrep, tr

On pourra ensuite projeter les pseudos colonnes et ne garder que les lignes qui contiennent les adjectifs

Commandes utilisées : cut, egrep

On concatènera l’ensemble des adjectifs trouvés avant de les trier…

Commandes utilisées : cat, sort

Etape 2 : filtrages

Après avoir choisi 5 adjectifs de cet index :

Extraire les zones textuelles contenant les adjectifs choisis et le numéro de l'infirmière associée

Extraire le premier mot des zones textuelles précédentes, les classer par infirmière, en faire le tri et les compter