Andrea Kuncova-Taillefer

Aude Maisondieu

Initialisation à XML

 

 

 

Ce qu'il faut construire

Objectif:

Tout d'abord, nous devons construire un corpus XML à partir d'un site HTML en ligne.

Pour cela il est nécessaire d'aspirer ce site c’est-à-dire l'enregistrer sur le disque dur (pour le rendre accessible lorsqu'on est déconnecté) dans la perspective de le soumettre à différents outils d'analyses textuelles (cf organigramme " Construction du corpus XML-Examens des occurrences " page 3).

Puis nous dégagerons les concordances des mots choisis par différents outils afin d'en analyser les patrons syntaxiques. En même temps nous ferons un comparatif des outils utilisés pour dégager ceux qui sont les plus adaptés à notre travail.

De plus , à l’aide du corpus initial XML, et en utilisant des petits programmes Perl, nous tenterons de construire des outils de filtrage afin de réaliser des opérations telles que le calcul du nombre de page, de liens du site, ou l’extraction des parties textuelles brut.

Ce qui est disponible

Corpus: un site "prématuré 96" en ligne:

http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/corpus/Prem/index.html

Les différents liens:

Etats du corpus

Un corpus de descriptions libres et de paramètres

Le corpus par bébé

La prématurité

Le corpus par infirmière

Travail sur Corpus

 

Lecture du corpus Prématurés

Le point d'entrée est fourni sur la page de sommaire. On peut y trouver des informations

Plusieurs versions distinctes du corpus sont données :

On utilisera les hyperliens pour passer d'un bébé à l'autre ou d'une infirmière à l'autre pour se faire une première opinion sur les facteurs qui expliquent le mieux les contrastes : la personnalité du bébé ou les projections de l'infirmière. L'entrée par catégories permettra par contre d'observer d'éventuelles différences de rédaction entre fiches (place respective des verbes ou des noms, par exemple).

Nous allons travailler sur les corpus suivants: "corpus par infirmière", "corpus par bébé".

Outils:

Httrack 2.02 (aspirateur développé par Xavier Roche, Yann Philippot)

Mkcorpus (outil d'édition et de manipulation de corpus balisés (SGML, XML, HTML), développé par Serge Fleury)

Cordial 6.01 (correcteur et analyseur de données textuelles développé par SYNAPSE)

Lexico3 (outils de statistiques textuelles, développé par André Salem, Cédric Lamalle)

Emacs (éditeur de texte)

Unix

Construction du corpus XML

Examens des occurrences

 

 

 

1ère étape: l'aspiration du site

 

A l'aide l'aspirateur Httrack, nous avons recopié le site "prématuré 96" sur le disque dur. Le site miroir est situé dans le dossier Prem. Lors de paramétrage de Httrack nous avons choisi les options par défaut.

Ce dossier se compose de six fichiers html: bebe.html, etat.html, inf.html, prematu.html, intro.html, index.html. A partir du fichier index.html nous pouvons naviguer sur tout le site.

 

 

2ème étape: Normalisation XML du site aspiré et création d'un corpus textuel

 

A l'aide du programme Mkcorpus,

-nous avons passé le fichier index.html par webxref37 (menu Typweb) qui transforme le fichier au format HTML en fichier au format XML.

-Pour exploiter les données textuelles du site prématuré (c’est-à-dire passer le corpus dans différents outils afin d’analyser les résultats), nous avons généré à l'aide de Mkcorpus un fichier texte brut (extrait les parties de textes brut) par les commandes suivantes:

Dans le menu "Select Markup", nous avons sélectionné "<SITEFileTxtBrut>" puis cliqué sur extract text.

 

3ème étape: Examen d'occurrences en corpus

3.1 Préparation

A l’aide des outils mis à notre dispositions, nous ferons l’examen de toutes les occurrences de certains mots afin de dégager leur emploi.

Les mots dont nous allons chercher les concordances sont: contact, douleur, sage, comportement, moins.

Ces mots ont été choisis de manière aléatoire excepté la forme " contact " qui nous à été proposée. Toutefois, nous avons tenté de choisir des mots dont les catégories diffèrent, à savoir nom (contact, douleur, comportement), adjectif (sage), adverbe (moins).

Pour chaque forme, nous étudierons les points suivants :

- nombre de bébés concernés

- nombre de d’infirmières concernées

- emploi avec un verbe ou non

- emploi singulier ou pluriel

- contexte positif ou négatif

- protagonistes du mot

 

 

 

1-bébé.HTML

Nous avons tout d’abord normalisé (passage mkcorpus :suppression de balises par " markup-delete ", plus suppression des marques HTML) le corpus bebe.HTML. Puis nous avons recherché les concordances des différents mots via les différents outils.

Lorsque nous avons voulu faire l’examen de toutes les occurrences des mots, nous avons constaté que les résultats n’étaient pas facilement exploitables, en effet il était très difficile de percevoir le nombre de bébé ou d’infirmières concernés.

exemple de résultat de concordance de "contact" avec mkcorpus

Mot n°Ligne # Extrait Contenu Ligne

contact 12 1 bébé réactif. établit un contact au moment des soins. bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement. a déjà ouvert les yeux. prend et cherche c

12 1 bébé réactif. établit un contact au moment des soins. bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement. a déjà ouvert les yeux. prend et cherche c

26 1 très endormi. aréactif. pas de contact. se laisse faire.

30 3 enfant sédaté, endormi. pâle, infecté, oedématié, raide. mâchonne ? réaction timide à la douleur. impossibilité de contact.

Nous avons constaté que le problème ne venait pas des outils utilisés pour la recherche de concordance mais qu’il est dû à la mise en page du site bebes.html (cf figure 1).

En effet ce qui est mis en évidence c'est le bébé et nous n'avons aucune information sur les infirmières.

De plus pour pouvoir compter le nombre de bébés il aurait fallu mettre sur chaque ligne le bébé concerné avec son numéro.

 

 

 

En conséquent nous avons opté pour recommencer les différentes étapes avec le site inf.html (cf figure 2). En effet, la mise en page de ce site permettra une exploitation plus aisée des résultats.

 

 

 

 

2- infirmiere.HTML:

Voici les changements réalisés à partir du inf.html pour effectuer et exploiter les différentes recherches :

-passage mkcorpus : -suppression de balise par " markup-delete "

-plus suppression des marques HTML du type &nsbp

-mettre sur chaque ligne l’infirmière concernée avec son numéro

Le fichier obtenu est nommé infirmi-nonbalise.txt et servira pour l’examen des occurrences de mots.

exemple du fichier infirmi-nonbalise.txt:

Infirmière 1 Bébé 2 Jour 0/1 bébé très sédaté. beau bébé, harmonieux, mais très malade. bébé très marbré, violet.

Infirmière 1 Bébé 5 Jour 7/1 très réactif. mais semble accepter sa machine.

Infirmière 1 Bébé 6 Jour 7/1 tranquille, calme. réactive aux soins et aux câlins. détendue.

 

3.2 Résultats

 

Cordial

 

Nous avons soumis le fichier infirmi-nonbalise.txt à Cordial, puis nous sommes passées par les étapes suivantes :

1-Sélection l’onglet " Syntaxe " et la sous-partie " occurrences des mots "

2-Choix du mot (Les paramètre sont laissé par défaut) Puis sélection du bouton " contextuel "

3-Sélection " Recherche sur mots entier " puis " ok "

4-Enregistrement du résultat dans un fichier.

Résultats :

Cordial recherche les concordances ligne par ligne et aligne le mot recherché.

Quand il y a deux fois le mot contact sur la même ligne, un seul est aligné avec les autres et le deuxième est aligné à la ligne suivante

Difficultés rencontrées :

Cordial recherche les concordances ligne par ligne et aligne le mot recherché, en conséquent nous n’avons pas toujours les débuts de lignes donc les numéros des bébés et des infirmières ne s’affichent pas.

Quand il y a deux fois le mot contact sur la même ligne, un seul est aligné avec les autres et le deuxième est aligné à la ligne suivante

 

Contact

 

Nombre de bébés concernés : 8 mais le résultat de Cordial ne permet pas de voir tous les bébés concernés par ce mot En effet, avec Cordial nous n’avons pas toujours les débuts de lignes donc les numéros des bébés ne s’affichent pas.

Nombre d’infirmières employant ce mot : on compte 6 infirmières différentes mais le résultat de Cordial ne permet pas de voir toutes les infirmières employant ce mot. (pour les mêmes raisons que pour le nombre de bébés).

Emploi avec un verbe ou non :

Avec un verbe

cherche le contact

refuse les contacts

recherche le contact

établit un contact

prend et cherche contact

contact peu facile à établir

sursaute au contact

réagit au contact de ses parents

Sans verbe

bon contact

bébé sans vraiment de contact

très bon contact

aucun contact

bébé agité au moment des contacts

pas de contact actuellement

peu de contact

impossibilité de contact

contact assez facile

bon contact

pas de contact

bon contact

peu de contacts

Emploi au singulier ou pluriel :

Singulier

cherche le contact

bon contact

bébé sans vraiment de contact

très bon contact

aucun contact

recherche le contact

établit un contact

prend et cherche contact

contact peu facile à établir

pas de contact actuellement

sursaute au contact

peu de contact

réagit au contact de ses parents

impossibilité de contact

contact assez facile

bon contact

pas de contact

bon contact

Pluriel

refuse les contacts

bébé agité au moment des contacts

peu de contacts

Contexte positif ou négatif :

Positif

cherche le contact

bon contact

très bon contact

recherche le contact

établit un contact

prend et cherche contact

sursaute au contact

réagit au contact de ses parents

contact assez facile

bon contact

bon contact

Négatif

bébé sans vraiment de contact

refuse les contacts

aucun contact

bébé agité au moment des contacts

contact peu facile à établir

pas de contact actuellement

peu de contact

impossibilité de contact

pas de contact

peu de contacts

Protagonistes du contact :

réagit au contact de ses parents

Les autres protagonistes ne sont pas spécifiés, on en déduit que les autres protagonistes sont les infirmières.

 

 

Comportement 

Nombre de bébés concernés : nous rencontrons le même problème qu’avec le mot contact, les débuts de lignes manquent donc nous ne pouvons pas compter les bébés concernés par ce mot

Nombre d’infirmières employant ce mot : idem

Emploi avec un verbe ou non :

Avec un verbe

Sans verbe : marrant par son comportement

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

bébé moyennement attirant par son comportement

Emploi au singulier ou pluriel :

Singulier : marrant par son comportement

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

bébé moyennement attirant par son comportement

Pluriel : Le nom comportement n’est pas employé au pluriel dans ce corpus.

Contexte positif ou négatif :

Positif : marrant par son comportement

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

Négatif : bébé moyennement attirant par son comportement

Protagonistes du comportement :

je le trouve marrant par son comportement (le bébé est mentionné par le pronom personnel " le ")

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

 

douleur

 

Nombre de bébés concernés : 1

Nombre d’infirmières employant ce mot : 1

Emploi avec un verbe ou non :

Avec un verbe

Sans verbe : réaction timide à la douleur

Emploi au singulier ou pluriel :

Singulier : réaction timide à la douleur

Pluriel : Le nom douleur n’est pas employé au pluriel dans ce corpus.

Contexte positif ou négatif :

Positif: Le nom douleur n’est pas employé dans un contexte positif dans ce corpus.

Négatif : réaction timide à la douleur

Protagonistes de la douleur : Le protagoniste n’est pas mentionné.

sage 

Nombre de bébés concernés : 2

Nombre d’infirmières employant ce mot : 2

Emploi avec un verbe ou non :

Avec un verbe:0

Sans verbe : bébé sage entre les soins

détendue, calme, sage

Emploi au singulier ou pluriel :

Singulier : bébé sage entre les soins

détendue, calme, sage

Pluriel : Le mot sage n’est pas employé au pluriel dans ce corpus.

Contexte positif ou négatif :

Positif : bébé sage entre les soins

détendue, calme, sage

Négatif:0

Protagonistes de sage :

bébé sage entre les soins

moins

Nous avons rencontré une difficulté avec l’adverbe " moins " :

En passant par l’onglet " syntaxe ", nous ne pouvions rechercher que les concordances de la forme " plus ou moins " et non " moins " seul. En effet, la forme moins est toujours utilisée sous la forme " plus ou moins " qui est une entrée du dictionnaire (une forme syntaxique).

Il a donc fallu modifier notre méthode de recherche :

Nous ne sommes plus passé par l’onglet " syntaxe " pour rechercher l’occurrence du mot " moins ", mais par l’onglet " orthographe " en sélectionnant " l’occurrence des mots orthographique ".

Nombre de bébés concernés :2

Nombre d’infirmières employant ce mot :2

Emploi avec un verbe ou non :

Avec un verbe : réagit plus ou moins aux soins

Sans verbe : peu agitée car plus ou moins sédatée

Emploi au singulier ou pluriel :

La question singulier pluriel ne se pose pas car il s’agit d’un adverbe

Contexte positif ou négatif :

La question positif ou négatif  ne se pose pas car il s’agit d’un adverbe dont le signifié est plutôt neutre.

 

Lexico3

 

Pour distinguer facilement le nombre de bébés et d’infirmières cela nécessite une préparation du fichier à savoir la création de partitions par bébé et par infirmière.

Préparation du fichier :

Le formatage du texte a été réalisé grâce à une macro à partir du fichier infirmi-nonbalise.txt

sous Emacs :

Nous avons encadré les mots "infirmière" et "bébé" par des chevrons et insérer un signe égal entre le mot et le chiffre concernant le mot en question (ex : <infirmiere=> X (X=chiffre))

Macro réalisée sous Emacs:

C-s ;; isearch-forward

infirmi ;; self-insert-command * 7

\350 ;; self-insert-command

re ;; self-insert-command * 2

SPC ;; self-insert-command

C-a ;; beginning-of-line

< ;; self-insert-command

C-s ;; isearch-forward

re ;; self-insert-command * 2

<right> ;; forward-char

DEL ;; delete-backward-char

=" ;; self-insert-command * 2

C-s ;; isearch-forward

SPC ;; self-insert-command

<left> ;; backward-char

"> ;; self-insert-command * 2

RET ;; newline

C-d ;; delete-char

< ;; self-insert-command

C-s ;; isearch-forward

SPC ;; self-insert-command

<left> ;; backward-char

C-d ;; delete-char

=" ;; self-insert-command * 2

2*C-s ;; isearch-forward

<left> ;; backward-char

"> ;; self-insert-command * 2

RET ;; newline

<down> ;; next-line

Exemple de texte non balisé:

Infirmière 3 Bébé 12 Jour 0/1 bébé calme, sédaté. réagit peu lors des soins.

Infirmière 3 Bébé 13 Jour 7/2 petit bébé calme. ouvre les yeux pendant les soins. semble vouloir tourner la tête de mon côté. semble écouter ce que je lui dis. reposé. n'est pas crispé pendant les soins.

Infirmière 3 Bébé 7 Jour 0/1 petit bébé calme, très peu réactif au moment des soins. fait quelques grimaces au moment des soins, mais ne bouge pas beaucoup. n'a pas encore ouvert les yeux.

Infirmière 3 Bébé 9 Jour 0/2 petit bébé très tonique. très réactif lors des soins. bouge beaucoup. fait des grimaces lors des mobilisations et lors des aspirations. se calme, se détend lorsque je caresse son visage et son crâne.

Exemple de texte balisé:

<Infirmière="1">

<Bébé="2">

Jour 0/1 bébé très sédaté. beau bébé, harmonieux, mais très malade. bébé très marbré, violet.

<Infirmière="1">

<Bébé="5">

Jour 7/1 très réactif. mais semble accepter sa machine.

<Infirmière="1">

<Bébé="6">

Jour 7/1 tranquille, calme. réactive aux soins et aux câlins. détendue.

Le fichier obtenu est nommé : Infirmi-balise.txt

Résultats :

Lexico 3 donne les résultats sous forme d’un fichier au format html.

Les résultats obtenus sont " partitionés " selon la partition choisie : infirmière ou bébé

La forme recherchée est alignées et colorées.

Lexico 3 n’affiche pas la ligne complète où se trouve le mot cherché toutefois nous pouvons élargir la " largeur " des concordances.

Difficultés rencontrées :

L’utilisation de Lexico3 sur le corpus ne nous permet pas de chercher les occurrences de contact au singulier et au pluriel en même temps donc nous répondrons aux questions séparément.

 

Contact

 

Nombre de bébés concernés : 10

Nombre d’infirmières employant ce mot : 7

Emploi avec un verbe ou non :

Avec verbe : cherche le contact

recherche le contact

établit un contact

prend et cherche contact

sursaute au contact

réagit au contact

Sans verbe : bon contact

sans vraiment de contact

très bon contact

aucun contact

contact peu facile à établir

pas de contact actuellement

peu de contact

impossibilité de contact

contact assez facile

bon contact

pas de contact

bon contact

Contexte positif : bon contact

ouvre les yeux et cherche le contact

très bon contact

recherche le contact

établit un contact

prend et cherche contact

sursaute au contact

réagit au contact de ses parents

contact assez facile

bon contact

bon contact

Contexte négatif : bébé sans vraiment de contact

aucun contact

contact peu facile à établir

pas de contact actuellement

peu de contact

impossibilité de contact

pas de contact

Protagonistes du contact :

réagit au contact de ses parents

Les autres protagonistes ne sont pas spécifiés, on en déduit que les autres protagonistes sont les infirmières.

 

Contacts

 

Nombre de bébés concernés :3

Nombre d’infirmières employant ce mot :3

Emploi avec un verbe ou non :

Avec verbe : refuse les contacts

Sans verbe : agité au moment des contacts

peu de contacts

Contexte:

positif:0

négatif :

refuse les contacts

peu de contacts

bébé agité au moment des contacts

Protagonistes du contact :

Les protagonistes ne sont pas spécifiés, on en déduit que les seules protagonistes sont les infirmières.

Comportement 

Nombre de bébés concernés :3

Nombre d’infirmières employant ce mot :2

Emploi avec un verbe ou non :

Avec verbe :

Le nom comportement n’est pas employé directement avec un verbe.(ni sujet, ni COD…)

Sans verbe :

marrant par son comportement

son apparence et son comportement

bébé moyennement attirant par son comportement

Emploi au singulier ou pluriel :

Singulier :

bébé moyennement attirant par son comportement

marrant par son comportement

son apparence et son comportement

Le nom comportements n’est pas employé au pluriel dans ce corpus.

Contexte positif:

je le trouve marrant par son comportement

Contexte négatif :

bébé moyennement attirant par son comportement

Contexte non spécifié (avec Lexico3) :

son apparence et son comportement

Nous n’avons pu spécifier le contexte car la partie des concordances à gauche de comportement n’est pas assez " large ", il aurait fallu faire un tri " avant " pour élargir le contexte.

Protagonistes du comportement:

je le trouve marrant par son comportement (le bébé est mentionné par le pronom personnel " le ")

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

 

douleur

 

Nombre de bébés concernés :1

Nombre d’infirmières employant ce mot :1

Emploi avec un verbe ou non :

Avec un verbe

réaction timide à la douleur

Sans verbe :0

Emploi au singulier ou pluriel :

Singulier

réaction timide à la douleur

Pluriel :0

Contexte positif ou négatif :

Positif

réaction timide à la douleur

Négatif:0

Protagonistes de la douleur : Le protagoniste n’est pas mentionné.

sage 

Nombre de bébés concernés :2

Nombre d’infirmières employant ce mot :2

Emploi avec un verbe ou non :

Avec un verbe :0

Sans verbe

bébé sage entre les soins

détendue , calme , sage

Emploi au singulier ou pluriel :

Singulier

bébé sage entre les soins

détendue , calme , sage

Pluriel :0

Contexte positif ou négatif :

Positif

bébé sage entre les soins

détendue , calme , sage

Négatif :0

Protagonistes de sage :

bébé sage entre les soins

moins

Nombre de bébés concernés :2

Nombre d’infirmières employant ce mot :2

Emploi avec un verbe ou non :

Avec un verbe

réagit plus ou moins aux soins

Sans verbe :

peu agitée car plus ou moins sédatée

Emploi au singulier ou pluriel :

La question singulier pluriel ne se pose pas car il s’agit d’un adverbe

Contexte positif ou négatif :

La question positif ou négatif  ne se pose pas car il s’agit d’un adverbe dont le signifié est plutôt neutre.

 

Emacs

 

Nous avons ouvert le fichier infirmi-nonbalise.txt sous Emacs, puis pour rechercher les occurrences des mots nous avons utilisées la macro " occur " selon les étapes suivantes :

1-Alt-X occur

2-Ecrire l’occurrence recherchée

Résultats

Les résultats sont affichés ligne par ligne dans une fenêtre, l’occurrence recherchée est en gras.

Difficultés rencontrées :

Nous n’avons pas rencontré de difficultés particulières à part un petit problème avec sage (cf sage).

La lecture des concordances ne posent aucune difficulté.

 

Contact

 

Nombre de bébés concernés : 11

Nombre d’infirmières employant ce mot : 8

Emploi avec un verbe ou non :

Avec un verbe : cherche le contact

refuse les contacts

recherche le contact

établit un contact au moment des soins

cherche contact avec ses mains (2° contact sur la même ligne —attention- vérifier)

contact peu facile à établir(2° contact sur la même ligne —attention- vérifier)

sursaute au contact

réagit au contact de ses parents

Sans verbe : bon contact

bébé sans vraiment de contact

très bon contact

aucun contact car dort

bébé agité au moment des contacts

pas de contact actuellement

peu de contact

impossibilité de contact

contact assez facile

bon contact

pas de contact

bon contact

peu de contacts

Emploi au singulier ou pluriel :

Singulier : bon contact

cherche le contact

bébé sans vraiment de contact

très bon contact

aucun contact car dort

recherche le contact

établit un contact au moment des soins

cherche contact avec ses mains

contact peu facile à établir

pas de contact actuellement

sursaute au contact

peu de contact

réagit au contact de ses parents

impossibilité de contact

contact assez facile

bon contact

pas de contact

bon contact

Pluriel : refuse les contacts

bébé agité au moment des contacts

peu de contacts

Contexte positif ou négatif :

Positif : bon contact

cherche le contact

très bon contact

recherche le contact

établit un contact au moment des soins

cherche contact avec ses mains

sursaute au contact

réagit au contact de ses parents

contact assez facile

bon contact

bon contact

Négatif : bébé sans vraiment de contact

refuse les contacts

aucun contact car dort

bébé agité au moment des contacts

contact peu facile à établir

pas de contact actuellement

peu de contact

impossibilité de contact

pas de contact

peu de contacts

Protagonistes du contact :

réagit au contact de ses parents

Comportement 

Nombre de bébés concernés :3

Nombre d’infirmières employant ce mot :2

Emploi avec un verbe ou non :

Avec un verbe

je le trouve marrant par son comportement

Sans verbe

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

bébé moyennement attirant par son comportement

 

Emploi au singulier ou pluriel :

Singulier

je le trouve marrant par son comportement

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

bébé moyennement attirant par son comportement

Pluriel Le nom comportement n’est pas employé au pluriel dans ce corpus.

Contexte positif ou négatif :

Positif

je le trouve marrant par son comportement

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

Négatif

bébé moyennement attirant par son comportement

Protagonistes du comportement:

je le trouve marrant par son comportement (le bébé est mentionné par le pronom personnel " le ")

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

 

douleur

 

Nombre de bébés concernés :1

Nombre d’infirmières employant ce mot : 1

Emploi avec un verbe ou non :

Avec un verbe:0

Sans verbe

réaction timide à la douleur

Emploi au singulier ou pluriel :

Singulier

réaction timide à la douleur

Pluriel:0

Contexte positif ou négatif :

Positif:0

Négatif:0

réaction timide à la douleur

Le nom douleur n’est pas employé au pluriel dans ce corpus.

Protagonistes de la douleur : Le protagoniste n’est pas mentionné.

sage 

La recherche du mot sage nécessite l'utilisation des expressions régulières afin de bien délimiter le mot (pour ne pas prendre des mots tels que visage):\bsage\b.

Nombre de bébés concernés :2

Nombre d’infirmières employant ce mot :2

Emploi avec un verbe ou non :

Avec un verbe:0

Sans verbe

bébé sage entre les soins

détendue, calme, sage

Emploi au singulier ou pluriel :

Singulier

bébé sage entre les soins

détendue, calme, sage

Pluriel:0

Contexte positif ou négatif :

Positif

bébé sage entre les soins

détendue, calme, sage

Négatif:0

Protagonistes de sage :

bébé sage entre les soins

moins

Nombre de bébés concernés :2

Nombre d’infirmières employant ce mot :2

Emploi avec un verbe ou non :

Avec un verbe

réagit plus ou moins aux soins

Sans verbe

peu agitée car plus ou moins sédatée

Emploi au singulier ou pluriel :

La question singulier pluriel ne se pose pas car il s’agit d’un adverbe

Contexte positif ou négatif :

La question positif ou négatif  ne se pose pas car il s’agit d’un adverbe dont le signifié est plutôt neutre.

 

 

 

 

 

 

Mkcorpus

 

Voici les étapes pour la recherche de concordances:

1-charger le fichier dans lequel nous voulons rechercher les concordances.

2-Saisir le mot recherché dans la fenêtre " search string ", nous avons cliqué sur l'item " search-global search ", toutes les occurrences du mot recherché clignotent dans le fichier chargé.

3-Ceci fait nous avons cliqué sur l'item " NPL Tools " et nous avons sélectionné " Concordance2 " (all word), une nouvelle fenêtre des résultats s'ouvre, cette fenêtre comporte toutes les concordances de tous les mots du fichier chargé.

4-il a fallu aller chercher les mots qui nous intéressaient et faire copier coller des résultats dans un fichier WordPad.

Il existe une autre possibilité de recherche de concordances des mots, au lieu de sélectionner " Concordance2 " (all word), on peut choisir " Concordance2 " (one word), les résultats obtenus sont les concordances d'un seul mot saisi au préalable dans la fenêtre " search string ". Au lieu de faire copier coller, il suffit d'enregistrer le résultat.

Nous avons effectué les deux types de recherche.

Notre préférence est pour la recherche " one word " - elle ne nécessite pas la recherche du mot qui nous intéresse dans un long fichier, nous avons un seul résultat immédiatement, par contre cette option demande un peu plus de manipulations si nous cherchons plusieurs concordances.

Difficultés rencontrées :

Il est difficile de chercher les occurrences de mot contact dans nos résultats (copiés-collés en WordPad) produits par Mkcorpus car les mots ne sont pas mis en évidence (par le gras/couleur/alignés). Toutefois en restant sous l’interface Mkcorpus les mots recherchés clignotent.

 

Contacts

 

Nombre de bébés concernés : 10

Nombre d’infirmières employant ce mot : 7

Emploi avec un verbe ou non :

Avec verbe : cherche le contact

recherche le contact

établit un contact

prend et cherche contact

sursaute au contact

réagit au contact

 

Sans verbe : bon contact

sans vraiment de contact

très bon contact

aucun contact

contact peu facile à établir

pas de contact actuellement

peu de contact

impossibilité de contact

contact assez facile

bon contact

pas de contact

bon contact

Contexte positif : bon contact

ouvre les yeux et cherche le contact

très bon contact

recherche le contact

établit un contact

prend et cherche contact

sursaute au contact

réagit au contact de ses parents

contact assez facile

bon contact

bon contact

Contexte négatif : bébé sans vraiment de contact

aucun contact

contact peu facile à établir

pas de contact actuellement

peu de contact

impossibilité de contact

pas de contact

Protagonistes du contact :

réagit au contact de ses parents

Les autres protagonistes ne sont pas spécifiés, on en déduit que les autres protagonistes sont les infirmières.

Comportement 

Nombre de bébés concernés : 3

Nombre d’infirmières employant ce mot : 2

Emploi avec un verbe ou non :

Avec un verbe :

je le trouve marrant par son comportement

Sans verbe:

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

bébé moyennement attirant par son comportement

Emploi au singulier ou pluriel :

Singulier:

je le trouve marrant par son comportement

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

bébé moyennement attirant par son comportement

Pluriel: Le nom comportement n’est pas employé au pluriel dans ce corpus.

Contexte positif ou négatif :

Positif:

je le trouve marrant par son comportement

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

Négatif:

bébé moyennement attirant par son comportement

Protagonistes du comportement:

je le trouve marrant par son comportement (le bébé est mentionné par le pronom personnel " le ")

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

 

douleur

 

Nombre de bébés concernés : 1

Nombre d’infirmières employant ce mot : 1

Emploi avec un verbe ou non :

Avec un verbe: réaction timide à la douleur

Sans verbe:0

Emploi au singulier ou pluriel :

Singulier: réaction timide à la douleur

Pluriel: Le nom douleur n’est pas employé au pluriel dans ce corpus.

Contexte positif ou négatif :

Positif:0

Négatif: réaction timide à la douleur

Le nom douleur n’est pas employé au pluriel dans ce corpus.

Protagonistes de la douleur : Le protagoniste n’est pas mentionné.

sage 

Nombre de bébés concernés : 2

Nombre d’infirmières employant ce mot : 2

Emploi avec un verbe ou non :

Avec un verbe:0

Sans verbe: bébé sage entre les soins

détendue, calme, sage

Emploi au singulier ou pluriel :

Singulier: bébé sage entre les soins

détendue, calme, sage

Pluriel:0

Contexte positif ou négatif :

Positif: bébé sage entre les soins

détendue, calme, sage

Négatif : :0

Protagonistes de sage :

bébé sage entre les soins

 

moins

Nombre de bébés concernés : 2

Nombre d’infirmières employant ce mot : 2

Emploi avec un verbe ou non :

Avec un verbe: réagit plus ou moins aux soins

Sans verbe: peu agitée car plus ou moins sédatée

Emploi au singulier ou pluriel : La question singulier pluriel ne se pose pas car il s’agit d’un adverbe

Contexte positif ou négatif : La question positif ou négatif ne se pose pas car il s’agit d’un adverbe dont le signifié est plutôt neutre.

 

Egrep

 

Ligne de commande :

Egrep " mot_recherché " infirmi-nonbalise.txt >fichier_de_sortie

Résultat :

Egrep extrait la ligne où se trouve le mot contact ce qui nous permet de visualiser au premier coup d'œil le nombre de bébé et d'infirmière

Difficultés rencontrées :

egrep ne met pas en évidence les occurrences des mots cherchés, de plus il peut avoir sur la même ligne deux fois le même mot, donc il faut bien lire tout ce qui est extrait pour ne pas en oublier.

 

Contact

 

Nombre de bébés concernés : 11

Nombre d’infirmières employant ce mot :8

Emploi avec un verbe ou non :

Avec un verbe

ouvre les yeux et cherche le contact

refuse les contacts

recherche le contact

établit un contact au moment des soins

agité au moment des contacts

contact peu facile à établir

sursaute au contact

réagit au contact de ses parents

 

Sans verbe

bon contact

bébé sans vraiment de contact

très bon contact

aucun contact car dort

pas de contact actuellement.

peu de contact

impossibilité de contact

bon contact

pas de contact

bon contact.

peu de contacts.

Emploi au singulier ou pluriel :

Singulier

bon contact

ouvre les yeux et cherche le contact

bébé sans vraiment de contact

très bon contact

aucun contact car dort

recherche le contact

établit un contact au moment des soins

contact peu facile à établir

pas de contact actuellement.

sursaute au contact

peu de contact

réagit au contact de ses parents

impossibilité de contact

bon contact

pas de contact

bon contact.

Pluriel

refuse les contacts

agité au moment des contacts

peu de contacts.

Contexte positif ou négatif :

Positif

bon contact

ouvre les yeux et cherche le contact

très bon contact

recherche le contact

établit un contact au moment des soins

sursaute au contact

réagit au contact de ses parents

bon contact

bon contact.

Négatif

bébé sans vraiment de contact

refuse les contacts

aucun contact car dort

agité au moment des contacts

contact peu facile à établir

pas de contact actuellement.

peu de contact

impossibilité de contact

pas de contact

peu de contacts.

Protagonistes du contact :

réagit au contact de ses parents

Comportement 

Nombre de bébés concernés :3

Nombre d’infirmières employant ce mot :2

Emploi avec un verbe ou non :

Avec un verbe

je le trouve marrant par son comportement

Sans verbe

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

bébé moyennement attirant par son comportement

(participe présent à valeur adjectival)

Emploi au singulier ou pluriel :

Singulier

je le trouve marrant par son comportement

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

bébé moyennement attirant par son comportement

Pluriel:0

Contexte positif ou négatif :

Positif

je le trouve marrant par son comportement

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

Négatif

bébé moyennement attirant par son comportement

Protagonistes du comportement:

je le trouve marrant par son comportement (le bébé est mentionné par le pronom personnel " le ")

bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement

 

douleur

 

Nombre de bébés concernés :1

Nombre d’infirmières employant ce mot :1

Emploi avec un verbe ou non :

Avec un verbe:0

Sans verbe

réaction timide à la douleur. impossibilité de contact.

Emploi au singulier ou pluriel :

Singulier

réaction timide à la douleur. impossibilité de contact.

Pluriel:0

Le nom douleur n’est pas employé au pluriel dans ce corpus.

Contexte positif ou négatif :

Positif

réaction timide à la douleur. impossibilité de contact.

Négatif:0

Protagonistes de la douleur : Le protagoniste n’est pas mentionné.

sage 

Nombre de bébés concernés : 2

Nombre d’infirmières employant ce mot : 2

Emploi avec un verbe ou non :

Avec un verbe:0

Sans verbe

bébé sage entre les soins

détendue, calme, sage

Emploi au singulier ou pluriel :

Singulier

bébé sage entre les soins

détendue, calme, sage

Pluriel:0

Contexte positif ou négatif :

Positif

bébé sage entre les soins

détendue, calme, sage

Négatif:0

Protagonistes de sage :

bébé sage entre les soins

 

 

moins

Nombre de bébés concernés : 2

Nombre d’infirmières employant ce mot : 2

Emploi avec un verbe ou non :

Avec un verbe

réagit plus ou moins aux soins

peu agitée car plus ou moins sédatée

Sans verbe:0

Emploi au singulier ou pluriel :

La question singulier pluriel ne se pose pas car il s’agit d’un adverbe

Contexte positif ou négatif :

La question positif ou négatif  ne se pose pas car il s’agit d’un adverbe dont le signifié est plutôt neutre.

 

Examen des occurrences des mots

 

Contact

 

Ce nom est plutôt employé avec un verbe et dans un contexte varié tantôt négatif , tantôt positif.

La forme contact est employée trois fois au pluriel contre 16 au singulier quelque soit le contexte (verbe/sans verbe, singulier/pluriel)

Les protagonistes de la forme contact sont précisés une fois : les parents.

On suppose que pour le reste des occurrences, il s’agit du contact entre le bébé et l’infirmière

 

Pour les formes qui suivent nous tenterons de dégager leur emploi dans le corpus.

Nous ne pourrons que faire part de nos observations et non faire une généralisation de l’emploi de ces mots dans le corpus.

En effet, le choix de ces formes ne permet pas de dégager assez d’occurrences pour pouvoir étendre leur emploi dans d’autres corpus sur les prématurés.

Comportement 

Le protagonistes du comportement sont le bébé car il s’agit de la description du comportement du bébé

Il s’agit du comportement du bébé par conséquent, ce nom est employé au singulier.

Il est employé avec les verbes aux participe passé à valeur adjectivale et nous avons conclu que les occurrences de "comportement" sont employées sans verbe.

 

douleur

 

Nous nous sommes étonnées que ce mot ne soit pas davantage employé dans ce corpus car il s’agit de prématurés qui sont en contact permanent avec la douleur.

Ce terme est employé sans verbe, au singulier, dans un contexte qui nous est difficile à déterminer. Toutefois d’un point de vue subjectif nous avons opté pour un contexte positif.

sage 

La forme sage est employée dans le corpus bébé en tant qu’adjectif.

Il n’est pas employé directement avec un verbe, mais il est associé à bébé.

L’emploi de ce mot est toujours en contexte positif.

Le protagoniste de l’adjectif sage est l’enfant, c’est pourquoi cet adjectif n’est utilisé qu’au singulier.

moins

La forme " moins " est utilisée uniquement sous la forme de la locution adverbiale " plus ou moins " et par conséquent avec un verbe.

Comme il s’agit d’une locution adverbiale donc invariable, on ne peut parler d’emploi singulier/pluriel ou d’emploi positif/négatif.

 

Résumé sur les outils

 

Les différents outils utilisés donnent d’un point de vue général les mêmes résultats.

Il est à noter que :

-Cordial ne nous permet de répondre à la question sur " le nombre d’infirmière/bébé ".

-Mkcorpus, egrep, ne mettent pas en évidence les occurrences recherchés dans les fichier résultats ( car il s’agit de fichier.txt).

-L’utilisation de Lexico3 nécessite une étape de préparation de fichier pour obtenir des résultats facilement exploitables.

-Emacs (avec occur) ne nous fournit pas les concordances immédiates des mots recherchés mais la phrase complète où se trouve le mot cherché.

D’un point de vue subjectif, pour l’examen d’occurrences en corpus, nous préférons Lexico3.

En effet bien qu’une préparation du texte (partition) est nécessaire ,dans certains cas les résultats fournis par Lexico3 sont clairs et exhaustifs (couleurs, concordances immédiates..).

 

4ème étape: Examen des patrons syntaxiques

Nous avons soumis à l'étiqueteur Cordial le fichier texte-brut produit par Mkcorpus. Après un paramétrage de l'étiquetage nous obtenons un fichier étiqueté (.cnr). Pour remettre en état les résultats produits par Cordial nous avons utilisé le programme Mkcorpus, nous avons chargé le fichier produit par Cordial et nous avons activé dans le menu "Corpus tools" l'item "make corpus tag-lexico". Les résultats obtenus n'étaient pas bons car nous avons utilisé au préalable une version de Cordial qui n'est pas reconnue par Mkcorpus. Après plusieurs essais sans succès, nous avons utilisé les résultats fournis par M. Fleury(merci). Le fichier utilisé pour la recherche des patrons syntaxiques se trouve dans le répertoire ResultatsCordial2, fichier cordialFormeCat.txt. Pour les segments répétés nous avons utilisé le fichier cordialCateg.txt.

Pour obtenir les patrons syntaxiques des différents mots, nous avons utilisés le bouton " concordance " de Lexico3.

Pour une meilleure compréhension des étapes par lesquelles nous avons du passer, nous avons construit un organigramme (cf : ci-dessous)

Recherche de patrons syntaxiques

(organigramme)

 

Résultats des concordances étiquetées

Concordance de : contact

 (tri ordre du texte)

_ PCTFORTE établit _ VINDP3S un _ DETIMS contact _ NCMS au moment des _ PREP soins _ NCMP 
end _ VINDP3S et _ COO cherche _ VINDP3S contact _ NCMS avec _ PREP ses _ DETPOSS mains _ 
 PCTFORTE aréactif _ NCI pas de _ ADJIND contact _ NCMS . _ PCTFORTE se _ PPER3S laisse _ 
 PCTFORTE impossibilité _ NCFS de _ PREP contact _ NCMS . _ PCTFORTE sédaté _ NCI car _ COO 
ignonne _ ADJFS . _ PCTFORTE bon _ ADJMS contact _ NCMS . _ PCTFORTE Jour _ NCMS 15 _ NCMIN 
PCTFORTE recherche _ VIMPP2S le _ DETDMS contact _ NCMS . _ PCTFORTE pleure _ VIMPP2S dans 
P et _ COO cherche _ VIMPP2S le _ DETDMS contact _ NCMS . _ PCTFORTE écoute _ VIMPP2S la 
 aux _ DETDPIG soins _ NCMP . _ PCTFORTE contact _ NCMS assez _ ADV facile _ ADJSIG . _ PCTFORTE 
non _ ADV agressifs _ ADJMP . _ PCTFORTE contact _ NCMS peu _ ADV facile _ ADJSIG à _ PREP 
oins _ NCMP . _ PCTFORTE pas de _ ADJIND contact _ NCMS actuellement _ ADV . _ PCTFORTE Jour 
 PCTFORTE sursaute _ VIMPP2S au _ DETDMS contact _ NCMS . _ PCTFORTE gêné _ VPARPMS dans 
TFORTE Jour _ NCMS 7 _ NCMIN bon _ ADJMS contact _ NCMS . _ PCTFORTE ouvre _ VIMPP2S les 
u _ COO dextro _ NCI peu _ ADV de _ PREP contact _ NCMS . _ PCTFORTE ne _ ADV tète _ VIMPP2S 
CMS sans _ PREP vraiment _ ADV de _ PREP contact _ NCMS . _ PCTFORTE Jour _ NCMS 7 _ NCMIN 
onique _ ADJSIG . _ PCTFORTE bon _ ADJMS contact _ NCMS . _ PCTFORTE réagit _ VINDP3S aux 
soins _ NCMP . _ PCTFORTE aucun _ ADJIND contact _ NCMS car _ COO dort _ VINDP3S + _ COO 
 _ PCTFORTE réagit _ VINDP3S au _ DETDMS contact _ NCMS de _ PREP ses _ DETPOSS parents _ 
ER3S . _ PCTFORTE très _ ADV bon _ ADJMS contact _ NCMS . _ PCTFORTE agité _ NCMS . _ PCTFORTE 
onique _ ADJSIG . _ PCTFORTE bon _ ADJMS contact _ NCMS . _ PCTFORTE réagit _ VINDP3S aux 
P et _ COO cherche _ VIMPP2S le _ DETDMS contact _ NCMS . _ PCTFORTE écoute _ VIMPP2S la 
CMS sans _ PREP vraiment _ ADV de _ PREP contact _ NCMS . _ PCTFORTE Bébé _ NCMS 10 _ NCMIN 
ER3S . _ PCTFORTE très _ ADV bon _ ADJMS contact _ NCMS . _ PCTFORTE agité _ NCMS . _ PCTFORTE 
soins _ NCMP . _ PCTFORTE aucun _ ADJIND contact _ NCMS car _ COO dort _ VINDP3S + _ COO 
 _ NCMIN recherche _ VIMPP2S le _ DETDMS contact _ NCMS . _ PCTFORTE pleure _ VIMPP2S dans 
_ PCTFORTE établit _ VINDP3S un _ DETIMS contact _ NCMS au moment des _ PREP soins _ NCMP 
end _ VINDP3S et _ COO cherche _ VINDP3S contact _ NCMS avec _ PREP ses _ DETPOSS mains _ 
non _ ADV agressifs _ ADJMP . _ PCTFORTE contact _ NCMS peu _ ADV facile _ ADJSIG à _ PREP 
oins _ NCMP . _ PCTFORTE pas de _ ADJIND contact _ NCMS actuellement _ ADV . _ PCTFORTE Bébé 
 PCTFORTE sursaute _ VIMPP2S au _ DETDMS contact _ NCMS . _ PCTFORTE gêné _ VPARPMS dans 
u _ COO dextro _ NCI peu _ ADV de _ PREP contact _ NCMS . _ PCTFORTE ne _ ADV tète _ VIMPP2S 
 _ PCTFORTE réagit _ VINDP3S au _ DETDMS contact _ NCMS de _ PREP ses _ DETPOSS parents _ 
 PCTFORTE impossibilité _ NCFS de _ PREP contact _ NCMS . _ PCTFORTE Bébé _ NCMS 3 _ NCMIN 
 aux _ DETDPIG soins _ NCMP . _ PCTFORTE contact _ NCMS assez _ ADV facile _ ADJSIG . _ PCTFORTE 
ignonne _ ADJFS . _ PCTFORTE bon _ ADJMS contact _ NCMS . _ PCTFORTE Bébé _ NCMS 8 _ NCMIN 
 PCTFORTE aréactif _ NCI pas de _ ADJIND contact _ NCMS . _ PCTFORTE se _ PPER3S laisse _ 
IN Jour _ NCMS 7 / 1 _ NCMIN bon _ ADJMS contact _ NCMS . _ PCTFORTE ouvre _ VIMPP2S les 
S . _ PCTFORTE Etablit _ NPI un _ DETIMS contact _ NCMS au _ DETDMS moment _ NCMS des _ DETDPIG 
end _ VINDP3S et _ COO cherche _ VINDP3S contact _ NCMS avec _ PREP ses _ DETPOSS mains _ 
 NCMP , _ PCTFAIB 1 _ ADJNUM bon _ ADJMS contact _ NCMS avec _ PREP eux _ PPER3P , _ PCTFAIB 
 PREP eux _ PPER3P , _ PCTFAIB 2 _ NCMIN contact _ NCMS moyen _ ADJMS , _ PCTFAIB 3 _ ADJNUM 
 , _ PCTFAIB 3 _ ADJNUM mauvais _ ADJMIN contact _ NCMS . _ PCTFORTE relat _ NCI mère _ NCFS 
_ PCTFORTE établit _ VINDP3S un _ DETIMS contact _ NCMS au _ DETDMS moment _ NCMS des _ DETDPIG 
end _ VINDP3S et _ COO cherche _ VINDP3S contact _ NCMS avec _ PREP ses _ DETPOSS mains _ 

" Contact " est employé en tant que nom commun.

Il est précédé soit d’une ponctuation (souvent " . "), soit d’un adjectif (bon ou mauvais), soit d’un déterminant (le, un, au, etc.), soit d’une préposition (de, etc.)

Il est suivi soit d’une ponctuation (souvent " . "), soit d’un adverbe, soit d’une préposition.

Concordance de : douleur
(tri ordre du texte)
CFS timide _ ADJSIG à _ PREP la _ DETDFS douleur _ NCFS . _ PCTFORTE impossibilité _ NCFS CFS timide _ ADJSIG à _ PREP la _ DETDFS douleur _ NCFS . _ PCTFORTE impossibilité _ NCFS

" douleur " est employé en tant que nom commun et est utilisé à deux reprises dans le corpus dans le même contexte (déterminant " la " + douleur+ ponctuation " . ")

Concordance de : sage
 (tri ordre du texte)

JFS , _ PCTFAIB calme _ NCMS , _ PCTFAIB sage _ ADJSIG . _ PCTFORTE mais _ COO manifeste 
TFORTE Jour _ NCMS 3 _ NCMIN bébé _ NCMS sage _ ADJSIG entre _ PREP les _ DETDPIG soins 
IN Jour _ NCMS 3 / 1 _ NCMIN bébé _ NCMS sage _ ADJSIG entre _ PREP les _ DETDPIG soins 
JFS , _ PCTFAIB calme _ NCMS , _ PCTFAIB sage _ ADJSIG . _ PCTFORTE mais _ COO manifeste 

" Sage " est employé en tant qu’adjectif, il est précédé pour moitié par la ponctuation ou par un nom commun, est suivi soit de la préposition " entre " soit d’une ponctuation (ponctuation + sage + préposition ou nom commun + sage + ponctuation).

Concordance de : comportement
(tri ordre du texte)
apparence _ NCFS et _ COO son _ DETPOSS comportement _ NCMS . _ PCTFORTE a _ VINDP3S déjà _ ADV marrant _ ADJMS par _ PREP son _ DETPOSS comportement _ NCMS qui _ PRI me _ PPER1S fait _ VINDP3S ttirant _ ADJMS par _ PREP son _ DETPOSS comportement _ NCMS . _ PCTFORTE dort _ VINDP3S en dehors marrant _ ADJMS par _ PREP son _ DETPOSS comportement _ NCMS qui _ PRI me _ PPER1S fait _ VINDP3S apparence _ NCFS et _ COO son _ DETPOSS comportement _ NCMS . _ PCTFORTE a _ VINDP3S déjà _ ADV ttirant _ ADJMS par _ PREP son _ DETPOSS comportement _ NCMS . _ PCTFORTE dort _ VINDP3S en dehors apparence _ NCFS et _ COO son _ DETPOSS comportement _ NCMS . _ PCTFORTE A _ VINDP3S déjà _ ADV apparence _ NCFS et _ COO son _ DETPOSS comportement _ NCMS . _ PCTFORTE a _ VINDP3S déjà _ ADV nviction _ NCFS . _ PCTFORTE Le _ DETDMS comportement _ NCMS psychologique _ ADJSIG des _ DETDPIG

" Comportement " est utilisé en tant que nom commun et est principalement précédé de l’adjectif possessif " son " et est suivi soit d’un verbe à l’indicatif soit d’une préposition.

Concordance de : moins
(tri ordre du texte)
u _ ADV agitée _ ADJFS car _ COO plus ou moins _ ADV sédatée _ NCI réactive _ VINDP3S aux Hypnovel _ NPI réagit _ VINDP3S plus ou moins _ ADV aux _ DETDPIG soins _ NCMP . _ PCTFORTE el _ ADJMS ou _ COO pesant _ VPARPRES au moins _ ADV 500 _ ADJNUM grammes _ NCMP , _ PCTFAIB uré _ ADJMS tout _ ADV enfant _ NCSIG de moins _ ADJINV de _ PREP 2500 _ ADJNUM grammes rammes _ NCMP . _ PCTFORTE Les _ DETDPIG moins _ NCMIN de _ PREP 1500 _ NCMIN grammes _ rématurés _ ADJMP et _ COO les _ DETDPIG moins _ NCMIN de _ PREP 1000 _ NCMIN grammes _ e _ ADJFS prématurité _ NCFS ( _ PCTFAIB moins de _ ADJIND 33 _ NCMIN SA _ NCFIN ) _ PCTFAIB PCTFAIB aucun _ ADJIND enfant _ NCSIG de moins _ ADJINV de _ PREP 23 _ NCMIN semaines _ ands _ ADJMP prématurés _ NCMP de _ PREP moins _ ADV de _ PREP 33 _ NCMIN semaines _ NCFP JFS prématurité _ NCFS enfants _ NCMP de moins _ ADJINV de _ PREP 33 _ NCMIN semaines _ _ NCMIN des _ DETDPIG enfants _ NCMP de moins _ ADJINV de _ PREP 33 _ NCMIN semaines _ Hypnovel _ NPI réagit _ VINDP3S plus ou moins _ ADV aux _ DETDPIG soins _ NCMP . _ PCTFORTE u _ ADV agitée _ ADJFS car _ COO plus ou moins _ ADV sédatée _ NCI réactive _ VINDP3S aux S prématuré _ NCMS né _ VPARPMS à _ PREP moins _ ADV de _ PREP 30 _ NCMIN semaines _ NCFP de _ NCFS chaque _ ADJIND bébé _ NCMS de moins _ ADJINV de _ PREP 30 _ NCMIN semaines _ SS naissance _ NCFS ( _ PCTFAIB à _ PREP moins _ ADV de _ PREP 24 _ NCMIN heures _ NCFP

" moins " est employé soit en tant qu’adverbe soit en tant qu’adjectif indéfini (et une fois comme un nom commun). Souvent il fait partie d’une locution adverbiale (plus au moins, de moins).

Quelque soit la catégorie de " moins ", il est régulièrement suivi par une préposition.

 

 

 

5ème étape: filtrage élémentaire

 

Programme inscrit dans le fichier page.pl

#!usr/bin/perl

open(Fichier,"$ARGV[0]");

print "nom du fichier de sortie-pages:";

chomp ($a=<STDIN>);

print "nom du fichier de sortie-liens:";

chomp ($b=<STDIN>);

open (res,">>$a");

open (resu,">$b");

$i=0;

$f=0;

while($ligne=<>){

if ($ligne =~/SITEFileName/){

{$i++;}

print res "$i : $ligne\n";

}

if ($ligne =~/<tagHTMLAttr TAG="a" NUM="[0-9]*" ATTRType="href"/){

{$f++;}

print resu "$f : $ligne\n";

}

}

close(res);

close(resu);

close(Fichier);

Ligne de commande sur Unix (après s'être placé)

perl page.pl corp-Prem.xml

 

Comptage de page dans le corp-Prem.xml

Resultats inscrit dans le fichier res.txt:

 

 

1 : <SITEFileName>C:/SFleury/CorpusWork/CorpusTAL/Prematures/Prem/index.html</SITEFileName>

2 : <SITEFileName>C:/SFleury/CorpusWork/CorpusTAL/Prematures/Prem/bebes.html</SITEFileName>

3 : <SITEFileName>C:/SFleury/CorpusWork/CorpusTAL/Prematures/Prem/prematu.html</SITEFileName>

4 : <SITEFileName>C:/SFleury/CorpusWork/CorpusTAL/Prematures/Prem/inf.html</SITEFileName>

5 : <SITEFileName>C:/SFleury/CorpusWork/CorpusTAL/Prematures/Prem/etats.html</SITEFileName>

6 : <SITEFileName>C:/SFleury/CorpusWork/CorpusTAL/Prematures/Prem/intro.html</SITEFileName>

Il y a donc 6 pages.

 

Comptage de lien dans le corp-Prem.xml

Resultats inscrit dans le fichier res2.txt:

1 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../index.htm"/>

2 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../index.htm"/>

3 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../indexTAL.htm"/>

4 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../indexTAL.htm"/>

5 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../module.htm"/>

6 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../module.htm"/>

7 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../cours.htm"/>

8 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../cours.htm"/>

9 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../qcm.htm"/>

10 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../qcm.htm"/>

11 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../sitetal.htm"/>

12 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../sitetal.htm"/>

13 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../corpus.htm"/>

14 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../corpus.htm"/>

15 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../biblital.htm"/>

16 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../biblital.htm"/>

17 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../index.htm"/>

18 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../index.htm"/>

19 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../indexTAL.htm"/>

20 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../indexTAL.htm"/>

21 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../module.htm"/>

22 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../module.htm"/>

23 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../cours.htm"/>

24 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../cours.htm"/>

25 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../qcm.htm"/>

26 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../qcm.htm"/>

27 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../sitetal.htm"/>

28 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../sitetal.htm"/>

29 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../corpus.htm"/>

30 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../corpus.htm"/>

31 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../biblital.htm"/>

32 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../biblital.htm"/>

33 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../index.htm"/>

34 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../index.htm"/>

35 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../indexTAL.htm"/>

36 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../indexTAL.htm"/>

37 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../module.htm"/>

38 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../module.htm"/>

39 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../cours.htm"/>

40 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../cours.htm"/>

41 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../qcm.htm"/>

42 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../qcm.htm"/>

43 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../sitetal.htm"/>

44 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../sitetal.htm"/>

45 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../corpus.htm"/>

46 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../corpus.htm"/>

47 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../biblital.htm"/>

48 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../biblital.htm"/>

49 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../index.htm"/>

50 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../index.htm"/>

51 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../indexTAL.htm"/>

52 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../indexTAL.htm"/>

53 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../module.htm"/>

54 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../module.htm"/>

55 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../cours.htm"/>

56 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../cours.htm"/>

57 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../qcm.htm"/>

58 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../qcm.htm"/>

59 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../sitetal.htm"/>

60 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../sitetal.htm"/>

61 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../corpus.htm"/>

62 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../corpus.htm"/>

63 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../biblital.htm"/>

64 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../biblital.htm"/>

65 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../index.htm"/>

66 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../index.htm"/>

67 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../indexTAL.htm"/>

68 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../indexTAL.htm"/>

69 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../module.htm"/>

70 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../module.htm"/>

71 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../cours.htm"/>

72 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../cours.htm"/>

73 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../qcm.htm"/>

74 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../qcm.htm"/>

75 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../sitetal.htm"/>

76 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../sitetal.htm"/>

77 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../corpus.htm"/>

78 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../corpus.htm"/>

79 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../biblital.htm"/>

80 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../biblital.htm"/>

81 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../index.htm"/>

82 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../index.htm"/>

83 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../indexTAL.htm"/>

84 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../indexTAL.htm"/>

85 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../module.htm"/>

86 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../module.htm"/>

87 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../cours.htm"/>

88 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../cours.htm"/>

89 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../qcm.htm"/>

90 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../qcm.htm"/>

91 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../sitetal.htm"/>

92 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../sitetal.htm"/>

93 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../corpus.htm"/>

94 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../corpus.htm"/>

95 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../biblital.htm"/>

96 : <tagHTMLAttr TAG="a" NUM="1" ATTRType="href" VALUE="../../biblital.htm"/>

 

Il y a donc 96 liens.

 

Lecture détaillée du programme

#!/usr/bin/perl

début de programme indiquant qu'il s'agit d'un programme Perl (chemin de l’interpréteur Perl,

#!: normalement # indique la présence d’un commentaire mais il est despécialisé par !).

open(Fichier,"$ARGV[0]");

ouverture du fichier donné en argument lors de l’appel du programme: perl page.pl corp-Prem.xml

 

print "nom du fichier de sortie-pages:";

la demande de saisir le nom de fichier de sortie (le fichier contiendra les résultats du comptage des pages) apparaîtra sur l'écran et l'utilisateur pourra saisir le nom du fichier qu'il désire

chomp ($a=<STDIN>);

le fichier saisi par l'utilisateur, sera associé à la variable scalaire $a

chomp - cette fonction enlève le signe retour chariot, il est important d'ajouter cette fonction ici, si on ne l'ajoute pas, le fichier ne sera pas reconnu comme existant

print "nom du fichier de sortie-liens:";

la demande de saisir le nom de fichier de sortie (le fichier contiendra les résultats du comptage des liens) apparaîtra sur l'écran et l'utilisateur pourra saisir le nom du fichier qu'il désire

chomp ($b=<STDIN>);

le fichier saisi par l'utilisateur, sera associé à la variable scalaire $b

open (res,">$a");

open (resu,">$b");

ouverture des fichiers de sortie, les fichiers peuvent être écrasés >$a >$b

$i=0;

$f=0;

initialisation des compteurs

while($ligne=<>){

la lecture du fichier d'entrée ligne par ligne ; le programme lit tant qu'il y a des lignes à lire et exécute les instructions notées plus bas ({if....})

if ($ligne =~/SITEFileName/){

{$i++;}

si l'on trouve, lors de la lecture du fichier, le motif SITEFileName, on incrémente le premier compteur

print res "$i : $ligne\n";

le résultat est écrit dans le fichier de sortie - numéro : ligne qui comporte le motif recherché -retour chariot

}

fermeture du bloc if

if ($ligne =~/<tagHTMLAttr TAG="a" NUM="[0-9]*" ATTRType="href"/){

{$f++;}

si l'on trouve, lors de la lecture du fichier, le motif <tagHTMLAttr TAG="a" NUM="[0-9]*" ATTRType="href", on incrémente le deuxième compteur f

 

print resu "$f : $ligne\n";

le résultat est écrit dans le fichier de sortie - numéro : ligne qui comporte le motif recherché -retour chariot

}

fermeture du bloc if

}

fermeture du bloc if

close(res);

close(resu);

close(Fichier);

fermeture du fichier lu et des fichiers de sortie

 

Programme inscrit dans le fichier extractextbrut.pl

#!usr/bin/perl

open(Fichier,"$ARGV[0]");

while($ligne=<Fichier>){

if (($ligne =~ /<SITEFileTxtBrut>(.*)/i) && ($ligne!~ /<\/SITEFileTxtBrut>/i)){

$aa ="$1";

until ($ligne =~/<\/SITEFileTxtBrut>/){

print "$ligne\n";

$ligne=<Fichier>;

break if $ligne == EOF;

}

$ligne=~/(.*)<\/SITEFileTxtBrut>/;

print "$aa";

}

}

close(Fichier);

 

Ligne de commande sur Unix (après s'être placé)

perl extractextbrut.pl corp-Prem.xml >textebrut.pl

textebrut.txt est le fichier de sortie où nous avons dirigé les résultats.

Extraction du texte brut dans le corp-Prem.xml

Resultats inscrit dans le fichier textebrut.txt:

Nous donnerons qu’une partie du corpus généré car il est très volumineux

Dans le résultat nous constatons que les balises <SITEFileTxtBrut> sont présentes, nous avons fait le choix de les conserver car elles constituent des partitions pour un éventuel traitement avec lexico3.

<SITEFileTxtBrut>

Corpus Prématurés 1996-1997

<SITEFileTxtBrut>

Home

<SITEFileTxtBrut>

Sommaire

<SITEFileTxtBrut>

Modules

<SITEFileTxtBrut>

Cours

<SITEFileTxtBrut>

QCM

<SITEFileTxtBrut>

Détours

<SITEFileTxtBrut>

Corpus

<SITEFileTxtBrut>

Biblio

<SITEFileTxtBrut>

 

 

Corpus Prématurés 1996-1997

 

 

Lecture détaillée du programme

#!usr/bin/perl

début de programme indiquant qu'il s'agit d'un programme Perl (chemin de l’interpréteur Perl,

#!: normalement # indique la présence d’un commentaire mais il est despécialisé par !).

open(Fichier,"$ARGV[0]");

ouverture du fichier donné en argument lors de l’appel du programme: perl page.pl corp-Prem.xml

while($ligne=<Fichier>){

la lecture du fichier d'entrée ligne par ligne ; le programme lit tant qu'il y a des lignes à lire et exécute les instructions notées plus bas ({if....})

if (($ligne =~ /<SITEFileTxtBrut>(.*)/i) && ($ligne!~ /<\/SITEFileTxtBrut>/i)){

$aa ="$1";

si l'on trouve, lors de la lecture du fichier, le motif

(<SITEFileTxtBrut>(.*)/i) && ($ligne!~ /<\/SITEFileTxtBrut>/i), on appelle (.*)(=soit $1) $aa

until ($ligne =~/<\/SITEFileTxtBrut>/){

print "$ligne\n";

Tant que l’on ne trouve pas <\/SITEFileTxtBrut>/, le programme imprime la ligne lue suivi d’un saut de ligne.

$ligne=<Fichier>;

break if $ligne == EOF;

 

la lecture du fichier ligne par ligne continue ($ligne=<Fichier>;); le programme lit tant qu'il y a des lignes à lire donc s’arrête lorsqu’il atteint la fin du fichier (break if $ligne == EOF;).

}

fermeture du bloc until

 

$ligne=~/(.*)<\/SITEFileTxtBrut>/;

print "$aa";

si l'on trouve, lors de la lecture de la ligne, le motif /(.*)<\/SITEFileTxtBrut>/;

le résultat $aa est écrit dans le fichier de sortie: ligne qui comporte le motif recherché.

}

fermeture du bloc if

 

}

fermeture du bloc while

close(Fichier);

fermeture du fichier lu et des fichiers de sortie

 

6ème étape: Nouvelle version du corpus prématurés au format XML

 

Nous nous sommes servies de l'outil XMLSpy pour construire la nouvelle version du corpus Prématurés.

Cette nouvelle version est une adaptation de ce que nous avons fait pour ce devoir et le corpus prématuré utilisé.

Le corps du texte se présente suit la forme du schéma ci-dessous

 

La DTD associée:

La DTD qui suit décrit la structure logique de notre document XML

<?xml version="1.0" encoding="UTF-8"?>

<!-- corpus="Prématurés" -->

<!ELEMENT corpusXML (header, corps)>

<!ELEMENT header (title, info_general, auteurs, date, langue)>

<!ELEMENT info_general (type, version)+>

<!ELEMENT corps (descr_travail, classement)>

<!ELEMENT classement (general+, classe_bebe+, classe_inf+)>

<!ELEMENT general (contact, douleur)>

<!ELEMENT classe_bebe (contact, douleur)>

<!ATTLIST classe_bebe

Val CDATA #REQUIRED

>

<!ATTLIST classe_inf

Val CDATA #REQUIRED

>

<!ELEMENT classe_inf (contact, douleur)>

<!ELEMENT contact (avec_verbe,sans_verbe,singulier,pluriel,positif,negatif)>

<!ELEMENT douleur (avec_verbe,sans_verbe,singulier,pluriel,positif,negatif)>

<!ELEMENT title (#PCDATA)>

<!ELEMENT langue (#PCDATA)>

<!ELEMENT auteurs (#PCDATA)>

<!ELEMENT date (#PCDATA)>

<!ELEMENT version (#PCDATA)>

<!ELEMENT type (#PCDATA)>

<!ELEMENT descr_travail (#PCDATA)>

<!ELEMENT avec_verbe (#PCDATA)>

<!ELEMENT sans_verbe (#PCDATA)>

<!ELEMENT singulier (#PCDATA)>

<!ELEMENT pluriel (#PCDATA)>

<!ELEMENT positif (#PCDATA)>

<!ELEMENT negatif (#PCDATA)>

Corpus XML

<?xml version="1.0" encoding="ISO-8859-1"?>

<!-- edited with XML Spy v3.0.7 (http://www.xmlspy.com) by an kunc (univ) -->

<!DOCTYPE corpusXML SYSTEM "corpus.dtd">

<corpusXML>

<header>

<title>

Prématurés

</title>

<info_general>

<type>

Corpus sur les prématurés.

</type>

<version>

1996

</version>

</info_general>

<auteurs>

Aude Maisondieu et Andrea Kuncova Taillefer

</auteurs>

<date>

janvier 2001

</date>

<langue>

français

</langue>

</header>

<corps>

<descr_travail>

Construction du corpus XML à partir du site HTML Prématurés96.

Recherche des occurences des mots, leurs concordances à l'aide des différents outils.

Etude des patrons syntaxiques.

</descr_travail>

<classement>

<general>

<contact>

<avec_verbe>cherche le contact

recherche le contact

établit un contact

prend et cherche contact

sursaute au contact

réagit au contact

refuse les contacts

</avec_verbe>

<sans_verbe>

bon contact

sans vraiment de contact

très bon contact

aucun contact

contact peu facile à établir

pas de contact actuellement

peu de contact

impossibilité de contact

contact assez facile

bon contact

pas de contact

bon contact

agité au moment des contacts

peu de contacts

</sans_verbe>

<singulier>bon contact

cherche le contact

bébé sans vraiment de contact

très bon contact

aucun contact car dort

recherche le contact

établit un contact au moment des soins

cherche contact avec ses mains

contact peu facile à établir

pas de contact actuellement

sursaute au contact

peu de contact

réagit au contact de ses parents

impossibilité de contact

contact assez facile

bon contact

pas de contact

bon contact

</singulier>

<pluriel>refuse les contacts

bébé agité au moment des contacts

peu de contacts

</pluriel>

<positif>bon contact

ouvre les yeux et cherche le contact

très bon contact

recherche le contact

établit un contact

prend et cherche contact

sursaute au contact

réagit au contact de ses parents

contact assez facile

bon contact

bon contact

</positif>

<negatif>bébé sans vraiment de contact

aucun contact

contact peu facile à établir

pas de contact actuellement

peu de contact

impossibilité de contact

pas de contact

refuse les contacts

peu de contacts

bébé agité au moment des contacts

</negatif>

</contact>

<douleur>

<avec_verbe>pas d'occurence</avec_verbe>

<sans_verbe>réaction timide à la douleur</sans_verbe>

<singulier>réaction timide à la douleur</singulier>

<pluriel>pas d'occurence</pluriel>

<positif>pas d'occurence</positif>

<negatif>réaction timide à la douleur</negatif>

</douleur>

</general>

<classe_bebe Val="bébé1">

<contact>

<avec_verbe>XXXX</avec_verbe>

<sans_verbe>XXXX</sans_verbe>

<singulier>XXXXXX</singulier>

<pluriel>XXXXX</pluriel>

<positif>XXXXX</positif>

<negatif>XXXXX</negatif>

</contact>

<douleur>

<avec_verbe>XXXXXXXX</avec_verbe>

<sans_verbe>XXXX</sans_verbe>

<singulier>XXXXXX</singulier>

<pluriel>XXXXX</pluriel>

<positif>XXXXX</positif>

<negatif>XXXXX</negatif>

</douleur>

</classe_bebe>

<classe_bebe Val="bébé2">

<contact>

<avec_verbe>XXXX</avec_verbe>

<sans_verbe>XXXX</sans_verbe>

<singulier>XXXXXX</singulier>

<pluriel>XXXXX</pluriel>

<positif>XXXXX</positif>

<negatif>XXXXX</negatif>

</contact>

<douleur>

<avec_verbe>XXXX</avec_verbe>

<sans_verbe>XXXX</sans_verbe>

<singulier>XXXXXX</singulier>

<pluriel>XXXXX</pluriel>

<positif>XXXXX</positif>

<negatif>XXXXX</negatif>

</douleur>

</classe_bebe>

<classe_inf Val="infirmière14">

<contact>

<avec_verbe>XXXXXX</avec_verbe>

<sans_verbe>XXXX</sans_verbe>

<singulier>XXXXXX</singulier>

<pluriel>XXXXX</pluriel>

<positif>XXXXX</positif>

<negatif>XXXXX</negatif>

</contact>

<douleur>

<avec_verbe>XXXXXX</avec_verbe>

<sans_verbe>XXXX</sans_verbe>

<singulier>XXXXXX</singulier>

<pluriel>XXXXX</pluriel>

<positif>XXXXX</positif>

<negatif>XXXXX</negatif>

</douleur>

</classe_inf>

</classement>

</corps>

</corpusXML>