Secteur TAL Informatique

ILPGA Université Paris 3

Parcours TAL : ressources

Etats du corpus Prématurés96

 

Le fichier de départ

Les fiches papier remplies par les infirmières du service de réanimation néo-natale ont été entrées dans un tableur (Excel).

Les lignes saisies sont de la forme :

101     N° 101 - Bébé réactif. - Etablit un contact au moment des soins. - Bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement. - A déjà ouvert les yeux. - Prend et cherche contact avec ses mains lorsqu'on le touche      101     s'aggrippe au doigt).  101     23,8    0 29,0    1       1       6,5     3       1580    3       5       0       5       5       2       17

Les intitulés des différentes colonnes sont les suivants :

n° fiche        texte   n° fiche        complément texte        n° fiche
age en h        age en j        terme en sem    mode accoucht   lieu    heure saisie    code inf        poids (g)       sédation        freq visit parents
relat inf/par   relat mère/bb   occup bb        Pntic   moral   score med
 
Leur signification est la suivante :
 
 

Intitulé Valeurs et consignes Commentaire
n° fiche
texte Consigne : aujourd'hui, comment pouvez-vous décrire ce bébé ? Comment se comporte-t-il, que fait-il  ? Quel genre de bébé est-ce ?
n° fiche
complément texte La description libre ne tient pas toujours dans une seule cellule de texte
n° fiche
age en h(eures)
age en j(ours)
terme en sem(aines) nombre de semaines d'aménorrhée
mode accouch(emen)t 1 voie basse 2 césarienne
lieu 1 Centre hospitalier où est le service de réanimation, 2 ailleurs
heure saisie (de la fiche)
code inf(irmière) On connait par ailleurs son âge, son niveau d'études, son cursus professionnel et son ancienneté dans le service.
 poids (g(rammes))
sédation 1 Hynovel, 2 Fentanyl, 3 non, 4 Hypnovel + Fentanyl
freq(uence) visit(es des) parents 1 très souvent (tous les jours), 2 souvent, 3 de temps en temps, 4 rarement ou jamais, 5 enfant à J0, question sans objet.
relat inf(irmière)/par(entes) 0 je ne connais pas les parents, 1 bon contact avec eux, 2 contact moyen, 3 mauvais contact.
relat mère/b(é)b(é) 1 très bonne mère (mère à l'aise, fait passer beaucoup de choses), 2 plutôt bonne, 3 plutôt mauvaise (tension, distance, agressivité), 4 très mauvaise, 5 je ne sais pas, pas vue.
occup b(é)b(é) Combien de fois vous êtes-vous déjà occupée de ce bébé (compter le jour courant) ?
Pntic (pronostic) Quel est votre pronostic sur ce bébé ? Actuellement, comment voyez-vous son avenir ? 1 très bon, 2 plutôt bon, 3 plutôt mauvais, 4 très mauvais, 5 je ne sais pas.
moral Comment vous sentez-vous aujourd'hui (moral, fatigue, etc.) 1 très bien, 2 plutôt bien, 3 plutôt mal, 4 très mal
score med(ical) gravité de l'état du bébé (plus le score est élevé, plus l'état de santé est inquiétant).

Le code général pour non-réponse est 99.
 

Restructuration

Pour faciliter l'utilisation du corpus et son retraitement, les champs positionnels ont été remplacés par des champs nommés, dont une balise ouvrante indique le contenu (il n'y a pas par contre de balise fermante). L'exemple donné supra devient :

<FICHE>101      <TXT> bébé réactif. établit un contact au moment des soins. bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement. a déjà ouvert les yeux. prend et cherche contact avec ses mains lorsqu'on le touche (s'aggrippe au doigt).  <BEBE>1 <JOURS>0       <INFIRMIERE>3 <HEURES>23,8     <OBSERVATION>1  <TERME>29,0 <ACCOUCHEMENT>1<LIEU>1 <HEURE_SAISIE>6,5       <POIDS>1580     <SEDATION>3     <VISITES_PARENTS>5      <INFIRMIERE-PARENTS>0   <MERE-BEBE>5    <CONTACTS-INFIRMIERE-BEBE>1     <PRONOSTIC>5  <MORAL>2 <SCORE>17
 
 

Présentation des versions textuelles

Plusieurs versions sont utilisables  : La première version (p96.tab) est disponible (au format HTML) : visualisation p96tab.htm.
La seconde version (p96.bal) est disponible (au format HTML) : visualisation p96bal.htm.

La première version (p96.tab) est disponible (au format TXT) : visualisation p96.tab.
La seconde version (p96.bal) est disponible (au format TXT) : visualisation p96.bal.
La version (p96.fic) est disponible (au format TXT) : visualisation p96.fic.
La version (p96.tag) est disponible (au format TXT) : visualisation p96.tag.

Les 4 fichiers dans une archive : Prem96.zip

Pour la visualisation des versions textuelles brutes, une étape de téléchargement est parfois nécessaire. Si tel est le cas placer le fichier cherché dans votre envirionnement de travail avant de le manipuler.

 
 

Présentation de la version hypertextuelle

Navigation et HTML

Les principes de la  navigation hypertextuelle sont présentés dans le document associé au lien précédent !

Pour une présentation du langage HTML, on se reportera aux documents présentés sur le site TAL-Paris3.
 

Lecture du corpus Prématurés

Le point d'entrée est fourni sur la page de sommaire. On peut y trouver des informations Plusieurs versions distinctes du corpus sont données : On utilisera les hyperliens pour passer d'un bébé à l'autre ou d'une infirmière à l'autre pour se faire une première opinion sur les facteurs qui expliquent le mieux les contrastes : la personnalité du bébé ou les projections de l'infirmière. L'entrée par catégories permettra par contre d'observer d'éventuelles différences de rédaction entre fiches (place respective des verbes ou des noms, par exemple).

Rechercher une entrée du TLFi :

 

Rechercher une entrée du XMLittré :