URIE

Christelle

 

 

 

 

 

 

Devoir n°1.

Corpus Prématurés 96 et Xml.

PLAN

w Etape N°2

Aspiration du Site Prématuré

Normalisation

Constitution d’un Corpus Textuel

w Etape n°3

3.1. Examen d’Occurrences en Corpus

Grep/Egrep

Cordial

MkCorpus

Lexico

CCL

3.2. Examen de Patrons Syntaxiques en Corpus

Extraction des parties textuelles

Etiquetage Cordial

Lexico

Concordances

Segments Répétés

Travail avec les Etiquettes Brutes

Concordances

Segments Répétés

CCL

w Etape n°4

Constitution d’un Corpus Xml

¨ Etape N°2.

Aspiration du site Prématurés 96.

Nous avons, à l’aide de l’aspirateur HTTrack, aspiré le site "Prématurés" au format Html. HTTrack nous restitue, dans un dossier "My Web Sites", toute une arborescence.

 

Normalisation.

Normalisation au format Xml à l’aide de l’outil MkCorpus.

® fichier corpPrem.xml

 

Constitution d’un corpus textuel.

r Sauvegarde au format .txt du corpus construit à l’étape 2.

® fichier corpPremXml.txt

Le fichier corpPremXml.txt représente donc l’arborescente Xml. On note, dans un premier temps, une partie introduite pas la balise <CORPUSHEAD>.

Cette première partie constitue l’en-tête du document et contient des balises nous apportant des informations telles que titre, nom des responsables du document, date, informations concernant l’édition, la publication, modalités de distribution du document,

description de projet...

La seconde partie, qui nous intéressera, introduite par la balise <CORPUSBODY>, constitue le corps du document. Elle contient en particulier les balises <FICHE>, suivies du numéro de fiche et du texte, et encadrant elles-mêmes d’autres balise nous renseignant

notamment sur le bébé concerné, le jour, l’infirmière, l’heure...

Rem : nous travaillerons à l’étape 3.1 sur le fichier corpPremXml.txt auquel nous aurons préalablement supprimé le contenu de l’en-tête (<CORPUSHEAD>...</CORPUSHEAD) afin de travailler sur le corps effectif du texte <CORPUSBODY>...</CORPUSBODY>.

 

¨ Etape n°3.

1. Examen d’Occurrences en Corpus.

ð Résultats dans le dossier "ExamenOccurrences".

Examen de toutes les occurrences de 5 formes dans le texte du fichier corpPremXml.txt.

Noter, pour chaque forme étudiée : - nombre de bébés concernés,

- nombre d’infirmières concernées,

- emploi avec verbe ou non,

- emploi singulier ou pluriel,

- contexte positif ou négatif,

- protagoniste précisé ou non.

º Extraction de motif avec Grep/Egrep.

º Cordial (option occurrences de mots).

º Lexico (construction de concordances sur les formes visées).

º MkCorpus ("item Concordance" du menu "NPL Tools").

Formes de travail : - contact/contacts.

- bien.

- calme.

- dormir (et ses dérivés).

- mais.

 

 

Grep/Egrep va nous permettre de rechercher les motifs.

Lancement successif de plusieurs commandes :

1. egrep —CA6 "motif " corpPremXml.txt >resuMotif.txt

® Les options permettent l’extraction de 2 lignes avant et 6 lignes après la ligne contenant le motif extraite. 2 lignes avant nous permettent d’extraire également le numéro de la fiche ; 6 lignes après nous permettent d’extraire le bébé, le jour et l’infirmière concernés.

2. egrep —c "motif" corpPremXml.txt >>resuMotif.txt

® L’option permet un comptage (seul) du nombre de lignes extraites, le résultat du comptage est concaténé (>>) au fichier resuMotif.txt.

 

Mais on note que Grep/Egrep extrait des lignes et les comptes sont ceux du nombre de lignes extraites. Il s’agit de l’extraction de lignes dans lesquelles le motif peut apparaître n fois. Aussi, le nombre de lignes n’est pas nécessairement égal au nombre total d’apparition du motif dans le texte et, de même, ce nombre de lignes ne correspond pas nécessairement au nombre de bébés ou d’infirmières concernés...

Ces 2 dernières commandes nous permettrons d’extraire les balises <BEBE> et <INFIRMIERE> suivies de leur numéro. L’observation des fichiers-sortie nous permettra de dégager le nombre de bébés et d’infirmières concernés.

3. egrep "<BEBE>[0-9]+" resuMotif.txt >resuBBMotif.txt

egrep "<INFIRMIERE>[0-9]+" resuMotif.txt >resuINFMotif.txt

Rem : Effectué en 2 fois pour faciliter la lecture des fichiers en sortie.

 

 

COMMANDES.

- contact egrep "contact" corpPremXml.txt >resuContact.txt

(Permettra l’extraction des formes au pluriel comme au singulier.)

- calme egrep "calme" corpPremXml.txt >resuCalme.txt

- bien egrep "bien" corpPremXml.txt >resuBien.txt

- mais egrep "mais" corpPremXml.txt >resuMais.txt

- dormir (et ses dérivés) egrep "dor(t|m)" corpPremXml.txt >resuDor.txt

(Ce motif permettra d’extraire les dérivés du verbe dormir ("dort", "dormant",

" endormi"... mais pas une forme telle que "adorable" par exemple.))

 

 

EXEMPLE FICHIERS RESULTATS.

CONTACT.

"resuContact.txt"

<NUMERO>101

</NUMERO>

<TXT> bébé réactif. établit un contact au moment des soins. bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement. a déjà ouvert les yeux. prend et cherche contact avec ses mains lorsqu'on le touche (s'aggrippe au doigt).

</TXT>

<BEBE>1

</BEBE>

<JOURS>0

</JOURS>

<INFIRMIERE>3

--

<NUMERO>231

</NUMERO>

<TXT> très endormi. aréactif. pas de contact. se laisse faire.

</TXT>

<BEBE>2

</BEBE>

<JOURS>3

</JOURS>

<INFIRMIERE>8

--

<NUMERO>273

</NUMERO>

<TXT> enfant sédaté, endormi. pâle, infecté, oedématié, raide. mâchonne ? réaction timide à la douleur. impossibilité de contact.

</TXT>

<BEBE>2

</BEBE>

<JOURS>7

</JOURS>

<INFIRMIERE>5

--

<NUMERO>371

</NUMERO>

<TXT> bébé bien tonique, voire très excitable. ouvre bien les yeux. gigotte beaucoup. très mignonne. bon contact.

</TXT>

<BEBE>3

</BEBE>

<JOURS>7

</JOURS>

<INFIRMIERE>6

--

<NUMERO>3152

</NUMERO>

<TXT> recherche le contact. pleure dans son incubateur. tire sur tous les fils. se calme quand on la prend dans les bras ou qu'on lui parle et la caresse. se promène dans son incubateur, très indépendante, fait ce qu'elle veut, refuse les soins (se débat, hurle). très coléreuse et très câline. beaucoup de caractère, qui sait ce qu'elle veut. chipie, très attentive et réceptive.

</TXT>

<BEBE>3

</BEBE>

<JOURS>15

</JOURS>

<INFIRMIERE>23

--

<NUMERO>531

</NUMERO>

<TXT> dort. très calme. bouge un peu les jambes quand on s'occupe de lui. n'ouvre pas les yeux. peu de contacts.

</TXT>

<BEBE>5

</BEBE>

<JOURS>3

</JOURS>

<INFIRMIERE>9

--

<NUMERO>601

</NUMERO>

<TXT> petite fille tonique, réactive, notamment aux soins. gesticule beaucoup, ouvre les yeux et cherche le contact. écoute la voix, n'aime pas être dérangée. c'est un bébé adorable qui laisse déjà entrevoir une personnalité dynamique et tonique. craquante.

</TXT>

<BEBE>6

</BEBE>

<JOURS>0

</JOURS>

<INFIRMIERE>1

--

<NUMERO>602

</NUMERO>

<TXT> peu agitée car plus ou moins sédatée. réactive aux soins. contact assez facile.

</TXT>

<BEBE>6

</BEBE>

<JOURS>0

</JOURS>

<INFIRMIERE>5

--

<NUMERO>632

</NUMERO>

<TXT> bébé agité au moment des contacts, des échanges pendant les soins, même lorsqu'il s'agit de soins non agressifs. contact peu facile à établir. bébé moyennement attirant par son comportement. dort en dehors des échanges bébé-infirmière.

</TXT>

<BEBE>6

</BEBE>

<JOURS>3

</JOURS>

<INFIRMIERE>3

--

<NUMERO>702

</NUMERO>

<TXT> bébé endormi car sédaté pour intubation. quelques réactions au moment des soins. pas de contact actuellement.

</TXT>

<BEBE>7

</BEBE>

<JOURS>0

</JOURS>

<INFIRMIERE>3

--

<NUMERO>733

</NUMERO>

<TXT> très tonique. très agité durant les soins seulement (algique ?). très réceptif aux bruits ++ qui l'environnent : enfant non calme, mais détendu. sursaute au contact. gêné dans son sommeil.

</TXT>

<BEBE>7

</BEBE>

<JOURS>3

</JOURS>

<INFIRMIERE>3

--

<NUMERO>871

</NUMERO>

<TXT> bon contact. ouvre les yeux. fait des petits sourires. bébé tonique, bien réactive et belle.

</TXT>

<BEBE>8

</BEBE>

<JOURS>7

</JOURS>

<INFIRMIERE>8

--

<NUMERO>9152

</NUMERO>

<TXT> bébé intubé. moyennement réactif. dort deaucoup. tonicité pendant les soins. des réactions à la lumière, au moment des soins désagréables tels qu'aspiration ou dextro. peu de contact. ne tète pas beaucoup le doigt, m'agrippe par le doigt avec ses mains. bouge peu bien que peu entravé dans ses mouvements. tourne un peu spontanément la tête au moment des aspirations, par dénégation.

</TXT>

<BEBE>9

</BEBE>

<JOURS>15

</JOURS>

<INFIRMIERE>3

--

<NUMERO>1032

</NUMERO>

<TXT> ce bété dort car sédaté. réagit aux soins en bougeant ses jambes et ses bras. bébé sans vraiment de contact.

</TXT>

<BEBE>10

</BEBE>

<JOURS>3

</JOURS>

<INFIRMIERE>23

--

<NUMERO>1071

</NUMERO>

<TXT> bébé qui dort entre les soins, refuse les contacts, pleure quand on le touche pour faire les soins. se contracte lors des caresses. se calme quand il tète. bébé inconfortable pendant les soins, détendu en dehors.

</TXT>

<BEBE>10

</BEBE>

<JOURS>7

</JOURS>

<INFIRMIERE>23

--

<NUMERO>1202

</NUMERO>

<TXT> bébé tonique. bon contact. réagit aux soins. ouvre les yeux, regarde autour de lui, gigote bien. petit doudou déjà très attachant, très présent. pleure aux soins. aime les paroles et les caresses.

</TXT>

<BEBE>12

</BEBE>

<JOURS>0

</JOURS>

<INFIRMIERE>1

--

<NUMERO>1333

</NUMERO>

<TXT> bébé endormi, sous Hypnovel. réagit plus ou moins aux soins. aucun contact car dort + + +.

</TXT>

<BEBE>13

</BEBE>

<JOURS>3

</JOURS>

<INFIRMIERE>23

--

<NUMERO>1371

</NUMERO>

<TXT> bété très réactif au toucher, mais calme. réagit au contact de ses parents.

</TXT>

<BEBE>13

</BEBE>

<JOURS>7

</JOURS>

<INFIRMIERE>44

--

<NUMERO>13152

</NUMERO>

<TXT> bébé très tonique, gigoteur. regarde autour de lui. très bon contact. agité.

</TXT>

<BEBE>13

</BEBE>

<JOURS>15

</JOURS>

<INFIRMIERE>23

19

"resuBBContact.txt"

<BEBE>1

<BEBE>2

<BEBE>2

<BEBE>3

<BEBE>3

<BEBE>5

<BEBE>6

<BEBE>6

<BEBE>6

<BEBE>7

<BEBE>7

<BEBE>8

<BEBE>9

<BEBE>10

<BEBE>10

<BEBE>12

<BEBE>13

<BEBE>13

<BEBE>13

19

"resuINFContact.txt"

<INFIRMIERE>3

<INFIRMIERE>8

<INFIRMIERE>5

<INFIRMIERE>6

<INFIRMIERE>23

<INFIRMIERE>9

<INFIRMIERE>1

<INFIRMIERE>5

<INFIRMIERE>3

<INFIRMIERE>3

<INFIRMIERE>3

<INFIRMIERE>8

<INFIRMIERE>3

<INFIRMIERE>23

<INFIRMIERE>23

<INFIRMIERE>1

<INFIRMIERE>23

<INFIRMIERE>44

<INFIRMIERE>23

19

ð cf. dossier Resu_Egrep.

Dans le menu Syntaxe>Occ de mots, le bouton "contextuel" nous permet d’enregistrer dans un fichier (extension .ctx) le contexte d’un mot donné.

Nous avons choisi l’ordre d’apparition dans le texte, conservation 50 caractères avant et après.

Les résultats ont été enregistrés dans un fichier "concordMotifCordial.ctx", puis "concordMotifCordial.txt".

Rem : Contrairement à Grep/Egrep, ici le nombre de lignes extraites correspond bien au nombre d’occurrences du motif recherché dans le texte, puisque Cordial extrait la ligne de contexte pour chaque occurrence du motif.

 

EXEMPLE FICHIERS RESULTATS.

MAIS.

"concordMaisCordial.ctx"

Concordances autour de "mais"

des soins. bébé attachant de par son histoire, mais aussi son physique,

<TXT> détendue, calme, sage. mais manifeste son mécontentement lorsque je lui fais

<TXT> bébé très sédaté. beau bébé, harmonieux, mais très malade. bébé très marbré, violet.

, bien réactive, attentive aux soins. tonique, mais calme. fait sa vie dans l'incubateur. se déplace.

dort. ne bouge pas. aréactif. petit bébé chétif, mais mignon.

<TXT> très réactif. mais semble accepter sa machine.

. fait quelques grimaces au moment des soins, mais ne bouge pas beaucoup. n'a pas encore ouvert les

bruits ++ qui l'environnent : enfant non calme, mais détendu. sursaute au contact. gêné dans son

bébé bien réactif pendant les soins, très actif, mais sait aussi être calme.

chétive et fragile. très attachant, calme, mais présent. bouge avec lenteur, ouvre les yeux lors

<TXT> très tonique, mais calme. pleure pendant les soins. ne veut pas

<TXT> bébé calme entre les soins, mais qui réagit lorsque l'on s'occupe de lui. réagit

<TXT> mignon. ne bouge pas, mais expressif.

<TXT> va mieux. toujours sédaté, mais plus réceptif au toucher.

<TXT> bété très réactif au toucher, mais calme. réagit au contact de ses parents.

place. sous photo., donc lunettes, ne voit rien, mais réagit à la voix.

 

ð cf. dossier Resu_Cordial.

 

 

MkCorpus nous permet également d’établir des concordances autour de formes-cibles.

Après avoir rentré le motif de travail dans l’espace "Search String" , nous avons activé l’item "concordance (one word 2)" du menu "NPL Tools".

Nous avons successivement entré les motifs : "contact", "calme", "bien", "mais et "dor(t|m)".

Les lignes de contextes sont précédées du numéro de ligne.

On notera, notamment dans les fichiers de résultats pour "contact" et "...dor...", que MkCorpus traite, contrairement aux deux outils précédents, plus particulièrement/plus rigoureusement les différentes formes dans lesquelles se trouve le motif recherché. Pour "contact", MkCorpus affiche l'une après l'autre les lignes de contexte pour le singulier puis pour le pluriel. Pour le motif "dot(t|m)", nous retrouvons successivement les formes "dormant", "dormir", "dort", "endormi/e", "rendort".

ð cf. dossier Resu_MkCorpus.

 

 

(Utilisation de Lexico3.)

Lexico nous a permis de construire des concordances autour des formes-pôles.

Lexico travaillant avec les formes lexicographiques, il nous a fallu faire les concordances pour chacune des formes lexicographiques dérivées de nos motifs de départ. Il s’agit notamment du singulier et du pluriel de "contact", et des formes "dort", "rendort", "endormi/e", "dormant", "dormir"pour le motif "dor".

Les résultats des concordances ont été enregistrés dans des fichiers "concordMotifLexico.doc" (obtenus par copier/coller).

 

EXEMPLE RESULTATS LEXICO. "concordMaisLexico.doc" :

MAIS.

Résultat Concordances "mais" Lexico3.

s . bébé attachant de par son histoire , mais aussi son physique , son apparence et son

de la voix 171 détendue , calme , sage . mais manifeste son mécontentement lorsque je

é très sédaté . beau bébé , harmonieux , mais très malade . bébé très marbré , violet

active , attentive aux soins . tonique , mais calme . fait sa vie dans l ' incubateur

uge pas . aréactif . petit bébé chétif , mais mignon . 5 3 4 - 2 26 , 4 1 1 21 830 4 1

830 4 1 0 5 1 3 3 30 571 très réactif . mais semble accepter sa machine . 5 7 11 - 1

quelques grimaces au moment des soins , mais ne bouge pas beaucoup . n ' a pas encore

qui l ' environnent : enfant non calme , mais détendu . sursaute au contact . gêné dans

réactif pendant les soins , très actif , mais sait aussi être calme . 8 15 14 - 1 27 2

ve et fragile . très attachant , calme , mais présent . bouge avec lenteur , ouvre les

30 3 99 0 5 3 2 2 16 1072 très tonique , mais calme . pleure pendant les soins . ne veut

2 2 26 1102 bébé calme entre les soins , mais qui réagit lorsque l ' on s ' occupe de

2 3 2 1 19 1332 mignon . ne bouge pas , mais expressif . 13 3 18 - 2 26 1 2 18 930 1

2 2 19 1334 va mieux . toujours sédaté , mais plus réceptif au toucher . 13 3 44 - 4 26

2 19 1371 bété très réactif au toucher , mais calme . réagit au contact de ses parents

photo . , donc lunettes , ne voit rien , mais réagit à la voix . 13 7 23 - 3 26 1 2 5

ð cf. dossier Resu_MkCorpus.

 

 

è Les résultats produits pas les différents outils utilisés permettent de dégager quelques éléments quant à l’emploi des formes pôles.

 

w Bien.

Nous avons pu compter 33 occurrences, présentes sur 23 lignes, de l’adverbe. 10 bébés et 15 infirmières sont concernés ; notons que l’infirmière 22 l’utilise 6 fois.

 

w Calme.

Le motif apparaît 51 fois sur 46 lignes. 12 bébés et 19 infirmières sont concernés.

 

w Contact/s.

Le motif "contact" apparaît 21 fois. On compte 18 occurrences pour la forme au singulier et 3 occurrences pour la forme au pluriel. On note aussi qu’on retrouve la forme 5 fois pour le bébé 3 et que l’infirmière 23 l’utilise 5 fois également.

 

w ...Dor...

Nous avons pu comptabiliser 34 occurrences du motif "dor". On le retrouve dans diverses dérivées du verbe dormir (1 occ) : dormant (1 occ), dort (21 occ), endormi (1 occ) et endormi (9 occ), rendort (1 occ).

12 bébés et 16 infirmières sont concernées.

 

w Mais.

Ce motif apparaît 16 fois sur 16 lignes dans notre corpus. 10 bébés et 13 infirmières sont concernés ; notons que l’outil Grep/Egrep a extrait 4 lignes de contexte pour le bébé 13.

 

2. Examen de Patrons Syntaxiques en Corpus.

ð Résultats dans le dossier "ExamenPatronsSyntaxiques".

º Extraction des parties textuelles du txt.

º Soumettre à Cordial.

º Lexico (soumettre corpus étiqueté et Recherche de patrons syntaxiques autour des formes pôles — Construction de Concordances et de Segments Répétés).

 

 

Extraction des parties textuelles.

A partir de MkCorpus, nous avons extrait les parties textuelles du corpus CorpPrem.xml initial.

Nous avons réalisé l’extraction des balises <SITEFileTxtBrut=NUM...> dans le menu "SelectMarkUp".

Nouveau fichier de travail ® fichier corpPremTxt.txt

Rem : fichier quelque peu différent du fichier traité à l’étape précédente, par conséquent le nombre d’occurrences des motifs da travail sera autre.

 

Etiquetage syntaxique : Cordial.

Nous avons soumis le fichier à l’analyseur syntaxique Cordial.

 

CONCORDANCES.

Après remise en état du résultat produit par Cordial, renouvellement des concordances autour des formes de travail à partir du nouveau fichier étiqueté.

ð cf. sous-dossier Resu_Lexico.

Les résultats des concordances ont été enregistrés dans des fichiers "concordMotifEtiqLexico.doc" (obtenus par copier/coller).

Nous avons noté, à cette étape, quelques bizarreries dans les résultats produits par Cordial.

Par exemple, Lexico a relevé 17 occurrences de "calme" étiqueté en tant que NCMS.

Prenons comme exemples :

_DETDMS toucher_NCMS , _PCTFAIB mais_COO calme_NCMS . _PCTFORTE réagit_VINDP3S au_DETDMS contact_NCMS

ORTE très_ADV attachant_ADJMS , _PCTFAIB calme_NCMS , _PCTFAIB mais_COO présent_NCMS . _PCTFORTE

t_ADJMS et_COO imprévu_ADJMS . _PCTFORTE calme_NCMS . _PCTFORTE pleure_VIMPP2S peu_ADV . _PCTFORTE

NCMS très_ADV attachant_ADJMS , _PCTFAIB calme_NCMS , _PCTFAIB délicat_ADJMS . _PCTFORTE semble_VIMPP2S

Alors qu’une seule occurrence correspond réellement à cette catégorie :

_PCTFORTE a_VINDP3S besoin_NCMS de_PREP calme_NCMS et_COO de_PREP repos_NCMIN pour_PREP le_DETDMS

Ou bien encore nous retrouvons quelques occurrences de "calme" Adjectif étiqueté comme Verbe.

NCMP . _PCTFORTE enfant_NCSIG plutôt_ADV calme_VINDP3S . _PCTFORTE petit_ADJMS bébé_NCMS très_ADV

_ADV tonique_ADJSIG , _PCTFAIB mais_COO calme_VINDP3S . _PCTFORTE pleure_VIMPP2S pendant_PREP

 

EXEMPLE RESULTATS LEXICO. "concordContact...EtiqLexico.doc" :

En extrait les formes au pluriel du lemme "contact".

Résultat Concordances "contacts_NCMP" Lexico3.

DPIG yeux_NCMP . _PCTFORTE peu de_ADJIND contacts_NCMP . _PCTFORTE dort_VINDP3S . _PCTFORTE ne_ADV

bé_NCMS agité_VPARPMS au moment des_PREP contacts_NCMP , _PCTFAIB des_DETDPIG échanges_NCMP pendant_PREP

MP , _PCTFAIB refuse_VIMPP2S les_DETDPIG contacts_NCMP , _PCTFAIB pleure_VINDP3S quand_SUB on_PPER3S

MP , _PCTFAIB refuse_VIMPP2S les_DETDPIG contacts_NCMP , _PCTFAIB pleure_VINDP3S quand_SUB on_PPER3S

bé_NCMS agité_VPARPMS au moment des_PREP contacts_NCMP , _PCTFAIB des_DETDPIG échanges_NCMP pendant_PREP

DPIG yeux_NCMP . _PCTFORTE peu de_ADJIND contacts_NCMP . _PCTFORTE Bébé_NCMS 7_NCMIN Jour_NCMS

 

 

SEGMENTS REPETES.

(formes)

On retrouve les segments dont la fréquence est au moins égal à 2. Nous avons supprimer le délimiteur "_" pour garder l’ensemble forme+étiquette.

Travail sur les formes - mais_COO,

- bien_ADV,

- calme_VINP3S,

- endormi_ADJMS,

- contatc_NCMS.

è mais_COO

è bien_ADV

 

 

è calme_VINDP3S

 

è endormi_ADJMS

 

 

 

è contact_NCMS

TRAVAIL AVEC LES ETIQUETTES BRUTES.

PARTRONS SYNTAXIQUES.

Nous travaillerons, à cette étape, à partir des fichiers résultants des concordances autour des formes pôles "concordMotifEtiqLexico.doc".

Rem : Il nous a été nécessaire, avant le nettoyage réalisé sous Emacs, de les sauvegarder au format .txt. Ainsi les fichiers "concordMotifEtiqLexico.doc" sont devenus "concordMotifEtiqLexico.txt" pour être plus facilement lisibles sous Emacs.

 

Afin de mettre à jour les patrons syntaxiques, en travaillant avec les étiquettes brutes, nous avons supprimé les formes.

Cependant, nous avons avant procédé, sous Emacs, à l’aide de macros, à quelques modifications sur nos textes :

º suppression de la catégorie de ponctuation.

º modification de l’étiquetage de nos formes pôles (ce qui nous permettra de ne pas les effacer en même temps que les autres formes du texte).

º suppression des formes.

Nous prendrons en exemple cet extrait du résultat de la concordance autour de la forme "mais" :

Concordances Mais etiq.

REP son_DETPOSS histoire_NCFS , _PCTFAIB mais_COO aussi_ADV son_DETPOSS physique_NCSIG , _PCTFAIB

_NCMS , _PCTFAIB sage_ADJSIG . _PCTFORTE mais_COO manifeste_VIMPP2S son_DETPOSS mécontentement_NCMS

, _PCTFAIB harmonieux_ADJMIN , _PCTFAIB mais_COO très_ADV malade_ADJSIG . _PCTFORTE bébé_NCMS

MP . _PCTFORTE tonique_ADJSIG , _PCTFAIB mais_COO calme_NCMS . _PCTFORTE fait_ADJMS sa_DETPOSS

_ADJMS bébé_NCMS chétif_ADJMS , _PCTFAIB mais_COO mignon_NCMS . _PCTFORTE Jour_NCMS 7_NCMIN

NCMIN très_ADV réactif_ADJMS . _PCTFORTE mais_COO semble_VIMPP2S accepter_VINF sa_DETPOSS

au moment des_PREP soins_NCMP , _PCTFAIB mais_COO ne_ADV bouge_VINDP3S pas_ADV beaucoup_ADV

...

 

º suppression de la catégorie de ponctuation.

Suppression d’un motif = remplacement de ce motif par Æ .

2 commandes successives.

Þ commandes : Search º Query replace regexp  _PCTFAIB with _ (Ã entrée)

Search º Query replace regexp  _PCTFORFTE with _ (Ã entrée)

Concordances Mais etiq.

REP son_DETPOSS histoire_NCFS , mais_COO aussi_ADV son_DETPOSS physique_NCSIG ,

_NCMS , sage_ADJSIG . mais_COO manifeste_VIMPP2S son_DETPOSS mécontentement_NCMS

, harmonieux_ADJMIN , mais_COO très_ADV malade_ADJSIG . bébé_NCMS

MP . tonique_ADJSIG , mais_COO calme_NCMS . fait_ADJMS sa_DETPOSS

_ADJMS bébé_NCMS chétif_ADJMS , mais_COO mignon_NCMS . Jour_NCMS 7_NCMIN

NCMIN très_ADV réactif_ADJMS . mais_COO semble_VIMPP2S accepter_VINF sa_DETPOSS

au moment des_PREP soins_NCMP , mais_COO ne_ADV bouge_VINDP3S pas_ADV beaucoup_ADV

...

 

º modification de l’étiquetage de nos formes pôles.

Nous avons fait la modification suivante "mais_COO" > "mais-COO".

Þ Enregistrement d’une macro.

— C-x-(

- débute l’enr. de la macro.

— C-s

- recherche du motif / de la forme pôle.

— C-d

- suppression du tiret bas "_ " ( à l’endroit où est positionne le curseur)

— taper

- "-" (tiret normal)

— C-a

- permet de revenir au début de la ligne

â

- permet d’aller sur la ligne suivante.

— C-x-)

- fin de l’enr. de la macro.

Concordances Mais etiq.

REP son_DETPOSS histoire_NCFS , mais-COO aussi_ADV son_DETPOSS physique_NCSIG ,

_NCMS , sage_ADJSIG . mais-COO manifeste_VIMPP2S son_DETPOSS mécontentement_NCMS

, harmonieux_ADJMIN , mais-COO très_ADV malade_ADJSIG . bébé_NCMS

MP . tonique_ADJSIG , mais-COO calme_NCMS . fait_ADJMS sa_DETPOSS

_ADJMS bébé_NCMS chétif_ADJMS , mais-COO mignon_NCMS . Jour_NCMS 7_NCMIN

NCMIN très_ADV réactif_ADJMS . mais-COO semble_VIMPP2S accepter_VINF sa_DETPOSS

au moment des_PREP soins_NCMP , mais-COO ne_ADV bouge_VINDP3S pas_ADV beaucoup_ADV

...

 

Rem sur les motifs de recherche :

Pour les formes "bien", "mais" et "calme", le motif de recherche reste la forme seule, le curseur se positionne automatiquement sur le caractère suivant (ici "_", ce qui permet de le l’effacer et de le remplacer directement.

Pour contact/contacts, nous avons cherché les deux formes + "_" ( I-search : contact_ puis I-search : contacts_ ) afin de ne pas effacer la forme au pluriel en n’effectuant que la recherche du 1er motif, aussi un retour en arrière d’un caractère a-t-il été nécessaire pour traiter le "_".

De même, pour les formes dérivées du verbe dormir, nous avons successivement entré plusieurs motifs de recherche également suivis du tiret bas "_".

Motifs : I-search :dormir_ ; I-search : dort_ (pour "dort" et "rendort")  ; I-search : dormant_ ; I-search : endormi_ puis endormie_.

 

º suppression des formes.

Þ Enregistrement d’une macro.

— C-x-(

- débute l’enregistrement de la macro.

— C-s

- recherche du caractère "_".

— C-Suppr.

- effacement arrière de mot

— C-x-)

- fin de l’enr. de la macro.

Concordances Mais etiq.

REP DETPOSS NCFS , mais-COO ADV DETPOSS NCMS , ADJSIG . mais-COO VIMPP2S DETPOSS NCMS

, ADJMIN , mais-COO ADV ADJSIG . NCMS

MP . ADJSIG , mais-COO NCMS . ADJMS ADJMS NCMS ADJMS , mais-COO NCMS . NCMS NCMIN

NCMIN ADV ADJMS . mais-COO VIMPP2S VINF DETPOSS

au moment PREP NCMP , mais-COO ADV VINDP3S ADV ADV

...

ð cf. sous-dossier EtiqBrutes.

Sauvegarde des concordances étiquettes brutes dans les fichiers "concordMotifEtiqBrutes.txt"

 

 

SEGMENTS REPETES ETIQUETTES BRUTES.

(catégories)

Travail sur les formes - mais-COO,

- bien-ADV,

- calme-VINP3S,

- ..dor...,

- contatc-NCMS.

 

 

 

è mais-COO

è bien-ADV

 

 

 

NCMS bien-ADV ADJSIG , ADV ADV ADJSIG . VIMPP2S bien-ADV DETDPIG NCMP . NCMS NCMIN ADJFS

S bien-ADV DETDPIG NCMP . lors IG NCMP . VIMPP2S bien-ADV VINF DETPOSS NCFP COO E VIMPP2S

ADJFS . bien-ADV ADJMS . NCMS VINDP3S . VIMPP2S bien-ADV . ADJSIG PREP NCMIN NCMS . ADV

SS NCFS . bien-ADV ADJMS . NCMS ADJSIG . VIMPP2S bien-ADV DETDPIG NCMP . ADV ADV . ADJMS

FS bien-ADV ADJFS , ADJMS . REP PPER3S , VIMPP2S bien-ADV . ADJMS NCFS NCMS DETDPIG NCMP

n-ADV ADJMS lors PREP DETDFS NCFS NCMS . VIMPP2S bien-ADV . VIMPP2S PREP NCMS NCMIN NCMS

DV ADJMS . ADV ADJMS . ADJMIN REP NCMP . VIMPP2S bien-ADV . PPER3S VINDP3S PREP MS , ADJSIG

IG . bien-ADV ADJMS . VIMPP2S REP NCMP . VIMPP2S bien-ADV . PPER3S VINDP3S PREP NCMS . VIMPP2S

2S bien-ADV . PPER3S VINDP3S PREP NCMS . VIMPP2S bien-ADV . VIMPP2S PREP NCMIN NCMS 15 /

ADJMS lors PREP DETDFS NCFS REP PPER3S , VIMPP2S bien-ADV . ADJMS NCFS ADV ADJSIG . VIMPP2S

MPP2S bien-ADV . ADJMS NCFS ADV ADJSIG . VIMPP2S bien-ADV DETDPIG NCMP . ADV S 15 / NCMIN

ADJFS . bien-ADV ADJMS . NCMS VINDP3S . VIMPP2S bien-ADV . ADJSIG PREP NCMIN MS 15 / NCMIN

NCMS bien-ADV ADJSIG , ADV ADV ADJSIG . VIMPP2S bien-ADV DETDPIG NCMP . NCI ORTE NCMS ADJSIG

S bien-ADV DETDPIG NCMP . lors IG NCMP . VIMPP2S bien-ADV VINF DETPOSS NCFP COO FAIB ADV

 

 

 

è calme-VINP3S

è ...dor...

 

 

 

è contact-NCMS

 

 

 

è Nous avons, à cette étape, étiqueté le corpus et reconstruit concordances et segments répétés autour des formes de travail choisies. Cet examen des patrons syntaxiques nous permet de préciser l’emploi de ces formes dans le texte.

 

w Bien.

L’adverbe "bien" apparaît souvent après un groupe verbal (GV) ("bouge bien", "réagit bien", "gigote bien"...) et très fréquemment il sert à introduire un groupe adjectival (GA) ("bien proportionné", "bien réactif", "bien coloré"...).

On note que ces groupes, relativement brefs, sont généralement encadrés de deux signes de ponctuation ; ils constituent des "énoncés autonomes".

 

w Calme.

Quant à la forme verbale du motif calme (calme_VINDP3S), il s’agit de la forme pronominale ; on la retrouve donc précédée du pronom personnel "se" (PPER3S calme_VINDP3S). Ce GV est souvent suivi d’un subordonnée (calme_VINDP3S SUB) ("se calme quand on la prend dans ses bras", " se calme lorsqu’... " ...) ou d’un groupe prépositionnel (GPREP) ("se calme au moment / en dehors des soins"...).

La forme adjectivale (calme_ADJSIG) se retrouve principalement près d’un GN ("bébé calme") et souvent avec un adverbe ("bébé bien / très / plutôt calme"...).

 

w Contact/s.

Cette forme, seule catégorie nominale notre liste, se retrouve comme on peut s‘y attendre dans des GN, avec ADJ ou ADV ("bon contact", "très bon contact", "contact assez facile", "peu /pas de contact"...).

Notons cependant l’absence notable de DET (exception faite des quelques cas l’on peut retrouver la forme dans une proposition plus complète (du type V Ct) comme par exemple "sursaute au contact", "prend et cherche un contact ...", "réagit au contact des parents", "refuse les contacts"...).

 

w ...dor...

• Le verbe "dort" est souvent suivi d’un ADV ("dort souvent / beaucoup"...) ou d’un GPREP ("dort entre / en dehors des soins"...).

Notons tout particulièrement que la forme conjuguée n’est quasiment jamais précédée de pronom personnel sujet.

• Les formes "endormi" et "endormie" sont généralement suivies d’ADV ("souvent / bien endormi"...) ou précédées d’un GN ("bébé endormi"...).

 

w Mais.

La conjonction de coordination "mais" est fréquemment suivie de GA ou de GN souvent introduits par un ADV ("mais calme", "mais très malade", "mais aussi son physique"...).

Il est intéressant de noter la position dans les énoncés de la conjonction. Faire la concordance du signe de ponctuation faible qu’est la virgule, nous permet de voir le même phénomène qu’avec l’ADV "bien" : elle constitue très fréquemment le 1er élément d’un groupe de sens assez bref.

 

 

è Nous pouvons conclure au regard des quelques formes étudiées (fréquence, catégorie syntaxique, segments répétés et position/emploi dans le discours...) que le corpus Prématurés P96 (constitué d’un ensemble de fiches composées en production libre) possède les caractéristiques du type de texte bien particulier que constitue la prise de notes.