TRAVAIL DE TD / INITIATION à xml

I) Rapport sur un document XML

Nous avons choisi de commenter le document manuel.xml qui se trouve sur le site Tal, TP9.

Ce document ne contenait pas de DTD, nous en avons donc générée une par le biais de l'outil XMLSpy.

Ainsi nous pouvons analyser une instance, une DTD et une arborescence générée par XMLSpy.

Document choisi :

<document>

<chapitre num="1">

<section num="1">

<titre>Qu'est ce que XML ?</titre>

<para>

<b>XML</b> est un langage de marquage constitu&#233; de balises tout comme HTML. Il se

situe &#224; mi-chemin entre SGML - le langage de r&#233;f&#233;rence en milieu professionnel pour la

gestion &#233;lectronique des documents (GED) - et HTML que l'on rencontre tous les jours sur

l'internet.

</para>

<para>Tout comme son cousin HTML, XML est directement issu de SGML. Cependant, il s'en

rapproche davantage dans le sens o&#249; l'ont peut dire que XML est une forme simplifi&#233;e de

SGML, car ce dernier est trop complexe pour s'afficher sur le WEB.

</para>

<para>XML est l'acronyme de e<b>X</b>tensible <b>M</b>arkup <b>L</b>anguage,

cela signifie que XML n'est pas un langage s&#233;mantiquement fig&#233; comme peut l'&#234;tre HTML

mais au contraire un langage ouvert. C'est &#224; dire que l'auteur d'un document XML peut

cr&#233;er ses propres balises, par exemple : la balise &lt;<code>INSTRUMENT</code>&gt; peut

&#234;tre d&#233;finie pour d&#233;signer un instrument de musique. Cela s'&#233;crirait de la fa&#231;on

suivante :

</para>

<tableau>

&lt;<code>INSTRUMENT</code>&gt;<code>Guitare</code>&lt;<code>/INSTRUMENT</code>&gt;

</tableau>

<para>Dans un document XML, on s'efforcera de ne pas tenir compte de la mise en forme mais

seulement du contenu de celui-ci; la mise en forme &#233;tant r&#233;alis&#233;e par la feuille de

style.

</para>

<para>D&#232;s lors, ont peut imaginer d'innombrables possibilit&#233;s que nous offre un tel

langage; par exemple dans l'&#233;change de donn&#233;es informatis&#233;es (EDI). Prenons par exemple

le secteur automobile, on pourrait employer les balises suivantes pour d&#233;crire un

v&#233;hicule: &lt;<code>TYPE MINE</code>&gt;, &lt;<code>CHASSIS</code>&gt;, &lt;<code>MOTEUR</code>&gt;,

&lt;<code>COULEUR</code>&gt;, ...

</para>

<para>Les donn&#233;es pouvant &#234;tre structur&#233;es, comme on d&#233;finirait un enregistrement <i>Moteur</i>

dans tout langage de programmation ou bien dans une base de donn&#233;es, en XML on &#233;crirait

:

</para>

<tableau>

&lt;<code>MOTEUR</code>&gt;<br/>

&#160;&#160;&#160;&#160;&#160;&#160;&#160; &lt;<code>PUISSANCE</code>&gt;......&lt;<code>/PUISSANCE</code>&gt;<br/>

&#160;&#160;&#160;&#160;&#160;&#160;&#160; &lt;<code>CYLINDREE</code>&gt;......&lt;<code>/CYLINDREE</code>&gt;<br/>

&#160;&#160;&#160;&#160;&#160;&#160;&#160; &lt;<code>NB SOUPAPES</code>&gt;......&lt;<code>/NB SOUPAPES</code>&gt;<br/>

&lt;<code>/MOTEUR</code>&gt;

</tableau>

<para>Et puisque dans un document XML l'information pertinente est marqu&#233;e par des balises

portant des noms significatifs, il sera plus facile de retrouver l'information en

s'appuyant sur le nom de ces balises pour effectuer des recherches.<br/>

En effet, en HTML on ne sait faire actuellement&#160; que de la&#160; recherche <font color="#FF0000">

<u>plein-texte</u>

</font> (full-text), ce qui la plupart du temps nous

retrouve beaucoup de documents qui n'ont rien &#224; voir avec notre recherche de d&#233;part,

c'est ce que l'on appelle le bruit.

</para>

<para>Dans notre exemple :</para>

<liste>

<li>* Un moteur de recherche pourrait ais&#233;ment retrouver tous les documents traitant des

moteurs 16 soupapes &#233;quipant un chassis d'un type donn&#233;. On serait alors s&#251;rs que les

r&#233;ponses correspondraient exactement &#224; nos crit&#232;res de s&#233;lection. Ainsi, les autres

documents ne traitant qu'un seul de ces deux crit&#232;res ne seront pas retourn&#233;s.</li>

<li>* De m&#234;me que l'utilisateur obtenant ces r&#233;ponses pourrait demander &#224; son application

de les classer par la puissance de ces moteurs.</li>

</liste>

</section>

<section num="2">

<titre>Origine et buts</titre>

<para>XML a &#233;t&#233; d&#233;velopp&#233; par le <b>XML Working

Group</b> (originellement connu comme le SGML Editorial Review Board) form&#233;

sous les auspices du World Wide Web Consortium (W3C) en 1996. Il &#233;tait

pr&#233;sid&#233; par Jon Bosak de Sun Microsystems avec la participation

active du XML Special Interest Group (anciennement SGML Working Group) &#233;galement

organis&#233; par le W3C.

</para>

<para>Voici les objectifs tels qu'ils sont d&#233;finis dans les sp&#233;cifications:</para>

<liste>

<li>* XML devra &#234;tre directement utilisable sur Internet</li>

<li>* XML devra supporter une large vari&#233;t&#233; d'applications</li>

<li>* XML devra &#234;tre compatible avec SGML</li>

<li>* La cr&#233;ation de pages XML devra &#234;tre aussi simple que possible</li>

<li>* XML ne devra pas poss&#233;der de fonctions facultatives</li>

<li>* Les documents XML devront &#234;tre d'une tr&#232;s grande lisibilit&#233;</li>

<li>* La cr&#233;ation de documents devra &#234;tre rapide</li>

<li>* La syntaxe devra &#234;tre formelle et concise</li>

<li>* La cr&#233;ation de documents XML devra &#234;tre facile</li>

<li>* La concision du code est d'une importance minime</li>

</liste>

</section>

</chapitre>

</document>

 

Cette structure peut être disposée en arbre. Il existe différents types d'arborescence. celle proposée par XMLSpy est très pratique car elle permet de déployer la structure comme on le souhaite. Ainsi on peut observer : la structure globale

ou bien la structure profonde d'1 section dans cet exemple ci.

La lecture de la structure globale et de la structure profonde est ainsi plus aisée.

Analyse de l'instance du Document " manuel.xml "

Une instance , c'est un document qui fait apparaître la structure du document ainsi que son contenu. On remarque très nettement qu'il existe une hiérarchie descendante dans ce document, c'est-à-dire on va du plus " englobant " au plus précis en descendant.

Cette instance est donc composée d'un chapitre et de deux sections. Puis l'instance permet de visualiser en détaille ce que l'on trouve dans chaque section.

Cette instance est un document bien formé puisque l'on peut vérifier que toutes les balises sont composées d'une balise ouvrante et d'une balise fermante, de plus aucune balise ne se chevauche.

On peut noter que la lecture est facilitée par :

le jeu des couleurs : - balises en bleu,

- le nom des balises en bordeaux

- le texte en noir.

et de la disposition. : - le plus global à gauche,

- les structures profondes à droite et les éléments à statuts égaux sont

au même niveau. (en ce qui concerne les balises ouvrantes).

Par exemple le document contient 2 sections et les balises <section> se situent au même niveau (même espacement vers la droite).

Les balises les plus " englobantes " ont leurs balises ouvrantes au début du document et se referment à la suite de tout ce qu'elles contiennent. Ainsi le document est formé d'une balise ouvrante au début du document et d'une fermante à la fin.

Cette disposition ressemble à celle des documents HTML.

 

La structure est :

La déclaration du code xml

L'appel de la feuille de style

L'appel de la DTD, générée à l'aide d' XMLSpy

Le document lui-même

Le document est composé de :

Un chapitre

Le chapitre comprend 2 sections

La première section porte le titre " Qu'est-ce que XML "

Il y a 8 paragraphes, 1 tableau et 1 liste

Dans les paragraphes il y a du texte, des mises en formes : gras, italique, retour chariot, souligné et couleur de caractère

Dans le tableau il y a du texte et des retours chariot

Dans la liste il y a du texte

La deuxième section porte le titre " Origine et buts "

I l y a 2 paragraphes et 1 liste

Dans les paragraphes il y a du texte, des mises en formes : gras

Dans la liste il y a du texte

Aussi, il est ainsi possible de créer l'arbre correspondant qui permet de faire apparaître de façon schématique la structure interne de ce document :

Analyse de la DTD : (ATTENTION Schéma qui apparaît si on fait aperçu mais n'apparaît pas dans le document ? ?)

Le but d'une DTD est non seulement de donner la structure interne du document mais surtout de donner les éléments et attributs qui la composent.

Dans la DTD, le texte du document n'apparaît pas puisque celle-ci peut être adaptée à tous les documents que l'on veut. Par contre la DTD indique le type de contenu qui peut apparaître dans les différentes parties du document.

Ainsi par exemple :

 

A la lecture de la dtd, on a les structures suivantes :

<!ELEMENT document (chapitre)>

Le document est fait d'un chapitre qui doit porter un numéro

<!ELEMENT chapitre (section+)>

<!ATTLIST chapitre num CDATA #REQUIRED>

Le chapitre est fait de plusieurs sections numérotées 1 et 2

<!ELEMENT section (titre+ | para+ | tableau+ | liste+)+>

<!ATTLIST section num (1 | 2) #REQUIRED>

La section est faite de titre(s), de paragraphe(s), de tableau(x) et de liste(s)

<!ELEMENT titre (#PCDATA)>

Le titre est du texte

<!ELEMENT para (#PCDATA | b | code | i | br | font)*>

Le paragraphe est du texte

<!ELEMENT b (#PCDATA)>

La balise gras comprend du texte

<!ELEMENT i (#PCDATA)>

La balise italique comprend du texte

<!ELEMENT br EMPTY>

Le retour chariot est vide

<!ELEMENT code (#PCDATA)>

La balise code comprend du texte

<!ELEMENT font (u)>

<!ATTLIST font color CDATA #REQUIRED>

<!ELEMENT u (#PCDATA)>

La balise font, qui doit comporter une couleur nommée, comprend une balise souligné qui contient du texte

<!ELEMENT tableau (#PCDATA | code | br)*>

Le tableau est fait de texte, de la balise code et du retour chariot

<!ELEMENT liste (li+)>

La liste est composée d'élément(s) listé(s)

<!ELEMENT li (#PCDATA)>

Les éléments listés sont du texte.

II) Cahier des Charges

Construction d'un corpus " Prématurés " en XML.

 

 

 

  1. Objectif :
  2. Le but de ce travail est de constituer un corpus XML contenant des résultats d'analyses textuelles à partir d'un site Internet aspiré.

  3. Matériels :

Pour cela nous disposons de différents outils comme :

  1. Travail :

Après avoir aspiré le site " Prématuré 96 ", on réalise une normalisation de ce site dans le format XML à l'aide de MkCorpus. En résumé, les étapes sont :

Après aspiration du site, on a un Répertoire " SitePrem " qui contient les pages HTML suivantes :

Quand on passe sous MkCorpus on appelle le miroir du site avec l'option WebXref qui fait un résumé du site page par page :

 

On obtient alors : (extrait)

<SITE>

<SITEName>Prem</SITEName>

<SITEFile>

<SITEFileName>C:/SFleury/CorpusWork/CorpusTAL/Prematures/Prem/index.html</SITEFileName>

<SITEReportFileName>index.html</SITEReportFileName>

<HEADER NUM="1">title: Corpus Prématurés 1996-1997</HEADER>

<tagHTML TAGType="html" NBATTR="0">BEGIN-html

</tagHTML>

<SITEFileTxtBrut TYPE="BLANKSPACE"> </SITEFileTxtBrut>

<tagHTML TAGType="head" NBATTR="0">BEGIN-head

</tagHTML>

<SITEFileTxtBrut TYPE="BLANKSPACE"> </SITEFileTxtBrut>

<tagHTML TAGType="title" NBATTR="0">BEGIN-title

</tagHTML>

<SITEFileTxtBrut>

Corpus Prématurés 1996-1997

</SITEFileTxtBrut>

<tagHTML TAGType="title">END-title</tagHTML>

<SITEFileTxtBrut TYPE="BLANKSPACE"> </SITEFileTxtBrut>

<tagHTML TAGType="head">END-head</tagHTML>

<SITEFileTxtBrut TYPE="BLANKSPACE"> </SITEFileTxtBrut>

<tagHTML TAGType="body" NBATTR="5">BEGIN-body

<tagHTMLAttr TAG="body" NUM="1" ATTRType="vlink" VALUE="#551a8b"/>

<tagHTMLAttr TAG="body" NUM="2" ATTRType="text" VALUE="#000000"/>

<tagHTMLAttr TAG="body" NUM="3" ATTRType="background" VALUE="../../image/ssbg75.jpg"/>

<tagHTMLAttr TAG="body" NUM="4" ATTRType="alink" VALUE="ff0000"/>

<tagHTMLAttr TAG="body" NUM="5" ATTRType="link" VALUE="#0000ee"/>

</tagHTML>

[÷]

<SITEFileTxtBrut TYPE="BLANKSPACE"> </SITEFileTxtBrut>

<tagHTML TAGType="sup" NBATTR="0">BEGIN-sup

</tagHTML>

<SITEFileTxtBrut>

2

</SITEFileTxtBrut>

<tagHTML TAGType="sup">END-sup</tagHTML>

<SITEFileTxtBrut>

bébé sédaté au Fentanyl + une injection d'Hypnovel, ce qui implique bébé très endormi, ne bouge pas et n'ouvre pas les yeux, pas de réaction aux soins douloureux ni au dextro. bébé très oedématié, très difficile à mobiliser. évolue depuis qu'il a évacué son Hypnovel. à cette heure-ci, ouvre les yeux, bouge un peu les membres. intubé.

</SITEFileTxtBrut>

<tagHTML TAGType="br" NBATTR="0">BEGIN-br

</tagHTML>

<SITEFileTxtBrut TYPE="BLANKSPACE"> </SITEFileTxtBrut>

<tagHTML TAGType="b" NBATTR="0">BEGIN-b

</tagHTML>

<SITEFileTxtBrut>

Jour 3

</SITEFileTxtBrut>

[÷]

A partir de ce corpus, on va extraire le texte brut uniquement, c'est à dire qu'on garde le texte contenu dans la balise <SiteFileTxtBrut> pour avoir au final :

[÷]

<SITEFileTxtBrut=NUM162>

Jour 0

<SITEFileTxtBrut=NUM163>

1

<SITEFileTxtBrut=NUM164>

bébé réactif. établit un contact au moment des soins. bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement. a déjà ouvert les yeux. prend et cherche contact avec ses mains lorsqu'on le touche (s'aggrippe au doigt).

<SITEFileTxtBrut=NUM165>

2

<SITEFileTxtBrut=NUM166>

tonique aux soins. réactif. calme en dehors des soins. détendu au bain.

<SITEFileTxtBrut=NUM167>

Jour 3

<SITEFileTxtBrut=NUM168>

1

<SITEFileTxtBrut=NUM169>

calme. détendu. tétouille sa sonde en dormant. attachant.

<SITEFileTxtBrut=NUM170>

2

<SITEFileTxtBrut=NUM171>

c'est une petite fille mignonne avec beaucoup de cheveux, qui lorsqu'elle est réveillée est très tonique, bouge beaucoup et pleure beaucoup. elle paraît plus vieille que son terme. lorsque je lui parle, elle ouvre les yeux et semble attentive au son de la voix

<SITEFileTxtBrut=NUM172>

Jour 7

<SITEFileTxtBrut=NUM173>

1

<SITEFileTxtBrut=NUM174>

détendue, calme, sage. mais manifeste son mécontentement lorsque je lui fais ses soins. cherche à téter. tourne sa tête, se positionne, se niche. bébé agréable, attachant.

<SITEFileTxtBrut=NUM175>

2

<SITEFileTxtBrut=NUM176>

bébé tonique et dynamique. très accrocheur. suit des yeux et ne lache pas. exigeante, elle manifeste jusqu'à ce que j'ai mis en place la situation qui lui convient (couverture ou tétine). bébé détendu, souriant. sait créer une interaction forte avec ses parents ou l'infirmière.

<SITEFileTxtBrut=NUM177>

3

<SITEFileTxtBrut=NUM178>

tonique. éveillée. s'exprime suivant les situations (soins, câlins). regarde quand on lui parle. jolie. agréable de s'en occuper. attachante. fait des mimiques. prend des positions pour dormir assez risibles. détendue quand elle dort. petite poupée avec de jolis cheveux noirs assez fournis. harmonie du corps. un peu mate de peau.

<SITEFileTxtBrut=NUM179>

Bébé 2

<SITEFileTxtBrut=NUM180>

(

<SITEFileTxtBrut=NUM181>

1

<SITEFileTxtBrut=NUM182>

3

<SITEFileTxtBrut=NUM190>

11

<SITEFileTxtBrut=NUM191>

12

<SITEFileTxtBrut=NUM192>

13

<SITEFileTxtBrut=NUM193>

)

<SITEFileTxtBrut=NUM194>

Jour 0

<SITEFileTxtBrut=NUM195>

1

<SITEFileTxtBrut=NUM196>

bébé très sédaté. beau bébé, harmonieux, mais très malade. bébé très marbré, violet.

<SITEFileTxtBrut=NUM197>

2

<SITEFileTxtBrut=NUM198>

hypotonique. aréactif. mauvais teint. labile. sensible au toucher lors des soins. grimaces lors des soins.

<SITEFileTxtBrut=NUM199>

Jour 3

<SITEFileTxtBrut=NUM200>

[÷]

Nous avons un corpus en XML prêt à être analysé. Mais il faut l'enregistrer en format txt pour qu'il soit utilisable.

 

Etape 3.3.1 :

Le but de cette étape est de faire l'examen de l'occurrence de 5 mots choisis dans le corpus Prématurés96.

Nous avons aspiré le corpus à l'aide de l'aspirateur de site HTTrack : nous avons construit un site mirroir de www.cavi.univ-paris3.fr/ilpga/ilpga/tal/corpus/prem/index.html puis nous l'avons placé dans le répertoire Premaspire de notre répertoire Maitrise.

Extrait du corpus Corprem.xml :

Ce corpus est édité sous XMLSpy.

<SITEFileTxtBrut TYPE="BLANKSPACE"> </SITEFileTxtBrut>

<COMMENT>Mirrored from www.cavi.univ-paris3.fr by HTTrack/1.x [RX/PY'99] </COMMENT>

<SITEFileTxtBrut TYPE="BLANKSPACE"> </SITEFileTxtBrut>

<tagHTML TAGType="head" NBATTR="0">BEGIN-head

</tagHTML>

tagHTML TAGType="b">END-b</tagHTML>

<SITEFileTxtBrut> b_ r_tif. _blit un contact au moment des soins. b_ attachant de par son histoire, mais aussi son physique, son apparence et son comportement. a d_ ouvert les yeux. prend et cherche contact avec ses mains lorsqu'on le touche (s'aggrippe au doigt). </SITEFileTxtBrut>

<tagHTML TAGType="br" NBATTR="0">BEGIN-br

</tagHTML>

<SITEFileTxtBrut TYPE="BLANKSPACE"> </SITEFileTxtBrut>

<tagHTML TAGType="b" NBATTR="0">BEGIN-b

</tagHTML>

<SITEFileTxtBrut>B_ 6 Jour 3/2</SITEFileTxtBrut>

<tagHTML TAGType="b">END-b</tagHTML>

<SITEFileTxtBrut> b_ agit_u moment des contacts, des _anges pendant les soins, m_ lorsqu'il s'agit de soins non agressifs. contact peu facile _tablir. b_ moyennement attirant par son comportement. dort en dehors des _anges b_-infirmi_. </SITEFileTxtBrut>

<tagHTML TAGType="br" NBATTR="0">BEGIN-br

</tagHTML>

<SITEFileTxtBrut TYPE="BLANKSPACE"> </SITEFileTxtBrut>

<tagHTML TAGType="b" NBATTR="0">BEGIN-b

Ce Corpus ne nous permettait de bien travaillé le texte du fait de sa disposition, nous avons donc choisi de prendre le corpus P96inf.html car c'est une version du corpus étiquetée par catégorie infirmière.

Voici un extrait de ce corpus :

Infirmière 1 ( 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24)
Bébé 2 Jour 0/1 bébé très sédaté. beau bébé, harmonieux, mais très malade. bébé très marbré, violet.
Bébé 5 Jour 7/1 très réactif. mais semble accepter sa machine.
Bébé 6 Jour 7/1 tranquille, calme. réactive aux soins et aux câlins. détendue.

Infirmière 2 ( 1 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24)
Bébé 12 Jour 15/2 bébé calme en denors des soins. dort. pleure au moment des soins. bouge bien. se défend en tournant la tête ou en la reculant lors des aspirations.
Bébé 12 Jour 3/1 bébé excitable. donne une impression d'inconfort. pleure beaucoup. se tient en hyperextension. fronce les sourcils.
Bébé 12 Jour 7/3 bébé calme dans l'ensemble. bouge bien. pleure pendant les soins?
Bébé 13 Jour 0/2 bébé calme et détendu. dort en denors des soins. pleure et gigote au moment des soins.
Bébé 9 Jour 3/1 bébé sage entre les soins. reste calme au moment des soins. bébé intéressé par la présence de l'infirmière. grimace au moment des soins, pleure carrément. tente d'ouvrir les yeux. remue beaucoup les jambes.
Bébé 9 Jour 7/2 bébé à l'apparence chétive et fragile. très attachant, calme, mais présent. bouge avec lenteur, ouvre les yeux lors de ma présence, pleure carrément.

Infirmière 3 ( 1 2 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24)
Bébé 12 Jour 0/1 bébé calme, sédaté. réagit peu lors des soins.
Bébé 13 Jour 7/2 petit bébé calme. ouvre les yeux pendant les soins. semble vouloir tourner la tête de mon côté. semble écouter ce que je lui dis. reposé. n'est pas crispé pendant les soins.
Bébé 7 Jour 0/1 petit bébé calme, très peu réactif au moment des soins. fait quelques grimaces au moment des soins, mais ne bouge pas beaucoup. n'a pas encore ouvert les yeux.
Bébé 9 Jour 0

 

 

On obtient ainsi un corpus XML brut.

On va donc le normaliser en le traitant sous MKCorpus.

Le but est de construire des corpus qui nous faciliterons l'étude du contexte et l'étude des occurrences (3.3.1), l'étude des patrons syntaxiques et des segments répétés.

Nous avons choisi d'analyser les 5 mots suivants :

- contact

- fatiguée

-parents

-tous

-établit

  1. EMACS :
  2. Nous avons cherché les occurrences de ces mots sous Emacs à l'aide de la macro

    occur en procédant comme suit :

    alt x occur contact

    Le programme nous a extrait toutes les lignes contenant le mot "contact".

    On se rend compte que dans l'état actuel de notre corpus nous sommes confrontés à un problème lié à la disposition (structure) du corpus. En effet, il nous est impossible de récupérer de façon automatique à quel paragraphe appartient chaque ligne. De ce fait, on ne peut identifier le bébé ou l'infirmière concernés par la ligne récupérée.

    Nous sommes confrontés à un problème d'étiquetage.

    Le travail sous EMACS nous permet d'obtenir les lignes contenant le mot recherché, mais nous n'avons pas le bébé ni l'infirmière concernés

    45 lines matching "contact" in buffer textbrutprem.xml.

    79:101 - Bébé réactif. - Etablit un contact au moment

    85:ouvert les yeux. - Prend et cherche contact avec ses mains lorsqu'on le

    190:0 je ne connais pas les parents, 1 bon contact avec eux, 2 contact

    191:moyen, 3 mauvais contact.<SITEFileTxtBrut=NUM71>

    237:CHEVRONG$TXTCHEVROND$ bébé réactif. établit un contact au

    243:ouvert les yeux. prend et cherche contact avec ses mains lorsqu'on le touche

    255:CHEVRONG$MERE-BEBECHEVROND$5 CHEVRONG$CONTACTS-INFIRMIERE-BEBECHEVROND$1

    510: bébé réactif. établit un contact au moment des soins. bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement. a déjà ouvert les yeux. prend et cherche contact avec ses mains lorsqu'on le touche (s'aggrippe au doigt).

    584: très endormi. aréactif. pas de contact. se laisse faire.

    598: enfant sédaté, endormi. pâle, infecté, oedématié, raide. mâchonne ? réaction timide à la douleur. impossibilité de contact.

    662: bébé bien tonique, voire très excitable. ouvre bien les yeux. gigotte beaucoup. très mignonne. bon contact.

    672: recherche le contact. pleure dans son incubateur. tire sur tous les fils. se calme qu

    Emacs ne reconnaît pas les caractères accentués et remplace par exemple " bébé " par " bibi " ou " près " par " prhs ".

    Nous avons effectué les mêmes opérations pour les 4 autres mots.

    Il nous faut donc faire un travail manuel où Emacs nous surligne la forme recherchée dans le corpus et nous recherchons manuellement les informations. Mais dans l'état actuel du corpus nous ne pouvons pas obtenir un réel fichier Résultat comme nous le souhaiterions pour répondre aux questions.

  3. MKCorpus :
  4. Ce logiciel permet d'extraire les données textuelles du corpus.

    Les balises du corpus vont être extraites par MKCorpus grâce à la commande Select Markup + nom de la (les) balise (s) à extraire + commande Extract + commande Save. Cette dernière fonction permet de conserver le nouvel état du corpus normalisé.

    Le corpus normalisé est maintenant prêt à être analysé.

  5. CORDIAL :
  6. Nous allons étiqueter le texte sous Cordial.

    Ce logiciel permet d'étiqueter le corpus selon des critères principalement syntaxiques.

    Résultats sous Cordial :

    0 \r<SITEFileTxtBrut=NUM134>\r\r(

    1 214 235 le le DETDMS 2|2 T 1

    2 214 235 bébé bébé NCMS 2|2 T 1

    3 214 235 est être VINDP3S 3 V 1

    4 214 235 endormi endormir VPARPMS 3|4 - 1 faire dormir

    5 214 235 , , PCTFAIB 3|4 - 1

    6 214 235 plus plus ADV - M 1

    7 214 235 calme calme ADJSIG - M 1

    8 214 235 ) ) PCTFAIB - - 1

    9 214 235 ou ou COO - - 1

    10 214 235 de de PREP 11|11 H 1

    11 214 235 <

    12 SITEFileTxtBrut sitefiletxtbrut NCI 11|11 H 1

    13 =

    14 214 235 NUM135 num135 NCI 12|12 D 1

    15 >

    16 214 235 >

    ===== FIN DE PHRASE =====

    ==== DEBUT DE PHRASE ====

    0 \r

    1 215 236 Fentanyl Fentanyl NPI 1 - 1 => Erreur orthographique: Fentanyl => Fenian

    ===== FIN DE PHRASE =====

    ==== DEBUT DE PHRASE ====

    0 \r<SITEFileTxtBrut=NUM136>\r,\r

    1 216 237 plus plus ADV - M 1

    2 216 237 puissant puissant ADJMS - M 1

    3 216 237 , , PCTFAIB - M 1

    4 216 237 qui qui PRI 4|4 S 1

    5 216 237 a avoir VINDP3S 5 V 1

    6 216 237 surtout surtout ADV - t 1

    7 216 237 des un DETDPIG 8|8 D 1

    8 216 237 propriétés propriété NCFP 8|8 D 1

    9 216 237 analgésiques analgésique ADJPIG 8|8 D 1

    10 216 237 . . PCTFORTE - - 0

    ===== FIN DE PHRASE =====

     

     

     

  7. LEXICO 3 :

On cherche à construire les concordances des mots que l'on cherche à étudier, mais on

se rend compte que le filtrage du texte tel qu'il est ne nous permet pas d'avoir toutes les informations pour répondre aux questions.

RECHERCHE DE CONCORDANCES :

1) sous Emacs:

11 lines matching "parents" in buffer corpPrem.txt.

115:sédation freq visit parents<SITEFileTxtBrut=NUM38>

178:freq(uence) visit(es des) parents

184:0 je ne connais pas les parents, 1 bon contact avec eux, 2 contact

247:CHEVRONG$VISITES_PARENTSCHEVROND$5 CHEVRONG$INFIRMIERE-PARENTSCHEVROND$0

403:parents, connaissance du bébé, pronostic sur le bébé).

528: bébé tonique et dynamique. très accrocheur. suit des yeux et ne lache pas. exigeante, elle manifeste jusqu'à ce que j'ai mis en place la situation qui lui convient (couverture ou tétine). bébé détendu, souriant. sait créer une interaction forte avec ses parents ou l'infirmière.

1154: tonique. moyennement bien coloré. réactif aux soins. éveillé. gesticule. serre le doigt. tète la tétine. bouge la tête et les membres. calme, dort, détendu. réactif à la voix des parents. ouvre les yeux. attrape des choses à sa portée lorsque cela touche sa main. bien proportionné.

1342: bété très réactif au toucher, mais calme. réagit au contact de ses parents.

2036: bébé tonique et dynamique. très accrocheur. suit des yeux et ne lache pas. exigeante, elle manifeste jusqu'à ce que j'ai mis en place la situation qui lui convient (couverture ou tétine). bébé détendu, souriant. sait créer une interaction forte avec ses parents ou l'infirmière.

2448: tonique. moyennement bien coloré. réactif aux soins. éveillé. gesticule. serre le doigt. tète la tétine. bouge la tête et les membres. calme, dort, détendu. réactif à la voix des parents. ouvre les yeux. attrape des choses à sa portée lorsque cela touche sa main. bien proportionné.

2824: bété très réactif au toucher, mais calme. réagit au contact de ses parents.

4 lines matching "tous" in buffer corpPrem.txt.

180:1 très souvent (tous les jours), 2 souvent, 3 de temps en temps,

666: recherche le contact. pleure dans son incubateur. tire sur tous les fils. se calme quand on la prend dans les bras ou qu'on lui parle et la caresse. se promène dans son incubateur, très indépendante, fait ce qu'elle veut, refuse les soins (se débat, hurle). très coléreuse et très câline. beaucoup de caractère, qui sait ce qu'elle veut. chipie, très attentive et réceptive.

1427:la loi du 8 janvier 1993, tous les enfants nés vivants à

2556: recherche le contact. pleure dans son incubateur. tire sur tous les fils. se calme quand on la prend dans les bras ou qu'on lui parle et la caresse. se promène dans son incubateur, très indépendante, fait ce qu'elle veut, refuse les soins (se débat, hurle). très coléreuse et très câline. beaucoup de caractère, qui sait ce qu'elle veut. chipie, très attentive et réceptive.

3 lines matching "établit" in buffer corpPrem.txt.

231:CHEVRONG$TXTCHEVROND$ bébé réactif. établit un contact au

504: bébé réactif. établit un contact au moment des soins. bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement. a déjà ouvert les yeux. prend et cherche contact avec ses mains lorsqu'on le touche (s'aggrippe au doigt).

2740: bébé réactif. établit un contact au moment des soins. bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement. a déjà ouvert les yeux. prend et cherche contact avec ses mains lorsqu'on le touche (s'aggrippe au doigt).

2 lines matching "fatiguée" in buffer corpPrem.txt.

636: endormie, passive, épuisée. bébé très attachant, calme, délicat. semble aussi très fatiguée, réagit peu lors des soins. semble même avoir du mal à garder ses paupières ouvertes. a besoin de calme et de repos pour le moment.

2312: endormie, passive, épuisée. bébé très attachant, calme, délicat. semble aussi très fatiguée, réagit peu lors des soins. semble même avoir du mal à garder ses paupières ouvertes. a besoin de calme et de repos pour le moment.

45 lines matching "contact" in buffer corpPrem.txt.

73:101 - Bébé réactif. - Etablit un contact au moment

79:ouvert les yeux. - Prend et cherche contact avec ses mains lorsqu'on le

184:0 je ne connais pas les parents, 1 bon contact avec eux, 2 contact

185:moyen, 3 mauvais contact.<SITEFileTxtBrut=NUM71>

231:CHEVRONG$TXTCHEVROND$ bébé réactif. établit un contact au

237:ouvert les yeux. prend et cherche contact avec ses mains lorsqu'on le touche

249:CHEVRONG$MERE-BEBECHEVROND$5 CHEVRONG$CONTACTS-INFIRMIERE-BEBECHEVROND$1

504: bébé réactif. établit un contact au moment des soins. bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement. a déjà ouvert les yeux. prend et cherche contact avec ses mains lorsqu'on le touche (s'aggrippe au doigt).

578: très endormi. aréactif. pas de contact. se laisse faire.

592: enfant sédaté, endormi. pâle, infecté, oedématié, raide. mâchonne ? réaction timide à la douleur. impossibilité de contact.

656: bébé bien tonique, voire très excitable. ouvre bien les yeux. gigotte beaucoup. très mignonne. bon contact.

666: recherche le contact. pleure dans son incubateur. tire sur tous les fils. se calme quand on la prend dans les bras ou qu'on lui parle et la caresse. se promène dans son incubateur, très indépendante, fait ce qu'elle veut, refuse les soins (se débat, hurle). très coléreuse et très câline. beaucoup de caractère, qui sait ce qu'elle veut. chipie, très attentive et réceptive.

762: dort. très calme. bouge un peu les jambes quand on s'occupe de lui. n'ouvre pas les yeux. peu de contacts.

830: petite fille tonique, réactive, notamment aux soins. gesticule beaucoup, ouvre les yeux et cherche le contact. écoute la voix, n'aime pas être dérangée. c'est un bébé adorable qui laisse déjà entrevoir une personnalité dynamique et tonique. craquante.

834: peu agitée car plus ou moins sédatée. réactive aux soins. contact assez facile.

848: bébé agité au moment des contacts, des échanges pendant les soins, même lorsqu'il s'agit de soins non agressifs. contact peu facile à établir. bébé moyennement attirant par son comportement. dort en dehors des échanges bébé-infirmière.

908: bébé endormi car sédaté pour intubation. quelques réactions au moment des soins. pas de contact actuellement.

922: très tonique. très agité durant les soins seulement (algique ?). très réceptif aux bruits ++ qui l'environnent : enfant non calme, mais détendu. sursaute au contact. gêné dans son sommeil.

992: bon contact. ouvre les yeux. fait des petits sourires. bébé tonique, bien réactive et belle.

1084: bébé intubé. moyennement réactif. dort deaucoup. tonicité pendant les soins. des réactions à la lumière, au moment des soins désagréables tels qu'aspiration ou dextro. peu de contact. ne tète pas beaucoup le doigt, m'agrippe par le doigt avec ses mains. bouge peu bien que peu entravé dans ses mouvements. tourne un peu spontanément la tête au moment des aspirations, par dénégation.

1134: ce bété dort car sédaté. réagit aux soins en bougeant ses jambes et ses bras. bébé sans vraiment de contact.

1140: bébé qui dort entre les soins, refuse les contacts, pleure quand on le touche pour faire les soins. se contracte lors des caresses. se calme quand il tète. bébé inconfortable pendant les soins, détendu en dehors.

1240: bébé tonique. bon contact. réagit aux soins. ouvre les yeux, regarde autour de lui, gigote bien. petit doudou déjà très attachant, très présent. pleure aux soins. aime les paroles et les caresses.

1332: bébé endormi, sous Hypnovel. réagit plus ou moins aux soins. aucun contact car dort + + +.

1342: bété très réactif au toucher, mais calme. réagit au contact de ses parents.

1360: bébé très tonique, gigoteur. regarde autour de lui. très bon contact. agité.

2240: bébé tonique. bon contact. réagit aux soins. ouvre les yeux, regarde autour de lui, gigote bien. petit doudou déjà très attachant, très présent. pleure aux soins. aime les paroles et les caresses.

2248: petite fille tonique, réactive, notamment aux soins. gesticule beaucoup, ouvre les yeux et cherche le contact. écoute la voix, n'aime pas être dérangée. c'est un bébé adorable qui laisse déjà entrevoir une personnalité dynamique et tonique. craquante.

2536: ce bété dort car sédaté. réagit aux soins en bougeant ses jambes et ses bras. bébé sans vraiment de contact.

2540: bébé qui dort entre les soins, refuse les contacts, pleure quand on le touche pour faire les soins. se contracte lors des caresses. se calme quand il tète. bébé inconfortable pendant les soins, détendu en dehors.

2544: bébé très tonique, gigoteur. regarde autour de lui. très bon contact. agité.

2548: bébé endormi, sous Hypnovel. réagit plus ou moins aux soins. aucun contact car dort + + +.

2556: recherche le contact. pleure dans son incubateur. tire sur tous les fils. se calme quand on la prend dans les bras ou qu'on lui parle et la caresse. se promène dans son incubateur, très indépendante, fait ce qu'elle veut, refuse les soins (se débat, hurle). très coléreuse et très câline. beaucoup de caractère, qui sait ce qu'elle veut. chipie, très attentive et réceptive.

2740: bébé réactif. établit un contact au moment des soins. bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement. a déjà ouvert les yeux. prend et cherche contact avec ses mains lorsqu'on le touche (s'aggrippe au doigt).

2744: bébé agité au moment des contacts, des échanges pendant les soins, même lorsqu'il s'agit de soins non agressifs. contact peu facile à établir. bébé moyennement attirant par son comportement. dort en dehors des échanges bébé-infirmière.

2748: bébé endormi car sédaté pour intubation. quelques réactions au moment des soins. pas de contact actuellement.

2752: très tonique. très agité durant les soins seulement (algique ?). très réceptif aux bruits ++ qui l'environnent : enfant non calme, mais détendu. sursaute au contact. gêné dans son sommeil.

2756: bébé intubé. moyennement réactif. dort deaucoup. tonicité pendant les soins. des réactions à la lumière, au moment des soins désagréables tels qu'aspiration ou dextro. peu de contact. ne tète pas beaucoup le doigt, m'agrippe par le doigt avec ses mains. bouge peu bien que peu entravé dans ses mouvements. tourne un peu spontanément la tête au moment des aspirations, par dénégation.

2824: bété très réactif au toucher, mais calme. réagit au contact de ses parents.

3008: enfant sédaté, endormi. pâle, infecté, oedématié, raide. mâchonne ? réaction timide à la douleur. impossibilité de contact.

3016: peu agitée car plus ou moins sédatée. réactive aux soins. contact assez facile.

3072: bébé bien tonique, voire très excitable. ouvre bien les yeux. gigotte beaucoup. très mignonne. bon contact.

3192: très endormi. aréactif. pas de contact. se laisse faire.

3200: bon contact. ouvre les yeux. fait des petits sourires. bébé tonique, bien réactive et belle.

3270: dort. très calme. bouge un peu les jambes quand on s'occupe de lui. n'ouvre pas les yeux. peu de contacts.

2) sous Lexico  (à partir du fichier étiqueté sous Cordial en Cordial2toLexico ):

Fatiguée : 2 occurrences

(tri ordre du texte)

nt , calme , délicat . semble aussi très fatiguée , réagit peu lors des soins . semble même

nt , calme , délicat . semble aussi très fatiguée , réagit peu lors des soins . semble même

établit : 3 occurrences

rpus Biblio Bébé 1 Jour 0 bébé réactif . établit un contact au moment des soins . bébé attachant

ière 17 Bébé 1 Jour 0 / 1 bébé réactif . établit un contact au moment des soins . bébé attachant

101 CHEVRONG TXTCHEVROND bébé réactif . établit un contact au moment des soins . bébé attachant

tous : 5 occurrences

(tri ordre du texte)

. pleure dans son incubateur . tire sur tous les fils . se calme quand on la prend dans

rhée . Depuis la loi du 8 janvier 1993 , tous les enfants nés vivants à partir de 22 semaines

. pleure dans son incubateur . tire sur tous les fils . se calme quand on la prend dans

isit ( es des ) parents 1 très souvent ( tous les jours ) , 2 souvent , 3 de temps en

isit ( être un ) parent 1 très souvent ( tous les jours ) , 2 souvent , 3 de temps en

parents : 10 occurrences

code inf poids ( g ) sédation freq visit parents relat inf / par relat mère / bb occup bb

Fentanyl freq ( uence ) visit ( es des ) parents 1 très souvent ( tous les jours ) , 2 souvent

/ par ( entes ) 0 je ne connais pas les parents , 1 bon contact avec eux , 2 contact moyen

ienneté dans le service , perception des parents , connaissance du bébé , pronostic sur le

ait créer une interaction forte avec ses parents ou l ' infirmière . 3 tonique . éveillée

, dort , détendu . réactif à la voix des parents . ouvre les yeux . attrape des choses à

, mais calme . réagit au contact de ses parents . 2 petit bébé calme . ouvre les yeux pendant

ait créer une interaction forte avec ses parents ou l ' infirmière . Bébé 3 Jour 0 / 3 bébé

, dort , détendu . réactif à la voix des parents . ouvre les yeux . attrape des choses à

, mais calme . réagit au contact de ses parents . Infirmière 19 ( 1 2 3 4 5 6 7 8 9 10 11

 

contact : 92 occurrences

101 NÉ 101 - Bébé réactif . - Etablit un contact au moment des soins . - Bébé attachant de

éjà ouvert les yeux . - Prend et cherche contact avec ses mains lorsqu ' on le touche 101

0 je ne connais pas les parents , 1 bon contact avec eux , 2 contact moyen , 3 mauvais contact

les parents , 1 bon contact avec eux , 2 contact moyen , 3 mauvais contact . relat mère /

t avec eux , 2 contact moyen , 3 mauvais contact . relat mère / b ( é ) b ( é ) 1 très bonne

TXTCHEVROND $ bébé réactif . établit un contact au moment des soins . bébé attachant de

déjà ouvert les yeux . prend et cherche contact avec ses mains lorsqu ' on le touche ( s

13 ) Jour 0 1 bébé réactif . établit un contact au moment des soins . bébé attachant de

déjà ouvert les yeux . prend et cherche contact avec ses mains lorsqu ' on le touche ( s

our 3 1 très endormi . aréactif . pas de contact . se laisse faire . Jour 7 1 bébé douloureux

n timide à la douleur . impossibilité de contact . 4 sédaté car douloureux . résiste aux

. gigotte beaucoup . très mignonne . bon contact . Jour 15 1 détendue , bien réactive , attentive

incubateur . se déplace . 2 recherche le contact . pleure dans son incubateur . tire sur

beaucoup , ouvre les yeux et cherche le contact . écoute la voix , n ' aime pas être dérangée

ou moins sédatée . réactive aux soins . contact assez facile . 3 ouvre les yeux à la stimulation

u ' il s ' agit de soins non agressifs . contact peu facile à établir . bébé moyennement

s réactions au moment des soins . pas de contact actuellement . Jour 3 1 petite puce adorable

t non calme , mais détendu . sursaute au contact . gêné dans son sommeil . Jour 7 1 très

résente pendant les soins . Jour 7 1 bon contact . ouvre les yeux . fait des petits sourires

tels qu ' aspiration ou dextro . peu de contact . ne tète pas beaucoup le doigt , m ' agrippe

mbes et ses bras . bébé sans vraiment de contact . Jour 7 1 bébé qui dort entre les soins

eu lors des soins . 2 bébé tonique . bon contact . réagit aux soins . ouvre les yeux , regarde

On note que dans les deux procédés nous n'avons pas d'informations sur les bébés, les infirmières, les protagonistes.

Par contre nous avons remarqué que l'étude par paragraphe sous Lexico permet d'obtenir des renseignements sur le bébé concerné à partir du corpus étiqueté par infirmière.

On peut étudier manuellement si la ligne contient un verbe ou pas (pas pour toutes les lignes), si l'emploie est au singulier ou pas, si le contexte semble positif ou pas.

On peut remarquer que la disposition est cependant plus claire sous Lexico puisque les occurrences sont alignées et mises en couleur ce qui facilite le repérage. ( la couleur dans le fichier Emacs a été ajoutée lors de la rédaction).

Résultats des extraits des fichiers construits sous MKCorpus :

Fichier Mkcontact.txt

nÉLigne # Extrait Contenu Ligne

contact 67 101 - Bébé réactif. - Etablit un contact au moment

70 ouvert les yeux. - Prend et cherche contact avec ses mains lorsqu'on le

157 0 je ne connais pas les parents, 1 bon contact avec eux, 2 contact

157 0 je ne connais pas les parents, 1 bon contact avec eux, 2 contact

158 moyen, 3 mauvais contact.<SITEFileTxtBrut=NUM71>

193 CHEVRONG$TXTCHEVROND$ bébé réactif. établit un contact au

196 ouvert les yeux. prend et cherche contact avec ses mains lorsqu'on le touche

386 bébé réactif. établit un contact au moment des soins. bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement. a déjà ouvert les yeux. prend et cherche co

Fichier Mkparents.txt

Mot nÉLigne # Extrait Contenu Ligne

parents 90 sédation freq visit parents<SITEFileTxtBrut=NUM38>

151 freq(uence) visit(es des) parents

157 0 je ne connais pas les parents, 1 bon contact avec eux, 2 contact

303 parents, connaissance du bébé, pronostic sur le bébé).

410 bébé tonique et dynamique. très accrocheur. suit des yeux et ne lache pas. exigeante, elle manifeste jusqu'à ce que j'ai mis en place la situation qui lui convient (couverture ou tétine). bébé

1036 tonique. moyennement bien coloré. réactif aux soins. éveillé. gesticule. serre le doigt. tète la tétine. bouge la tête et les membres. calme, dort, détendu. réactif à la voix des parents. ouvre

1224 bété très réactif au toucher, mais calme. réagit au contact de ses parents.

1854 bébé tonique et dynamique. très accrocheur. suit des yeux et ne lache pas. exigeante, elle manifeste jusqu'à ce que j'ai mis en place la situation qui lui convient (couverture ou tétine). bébé

2266 tonique. moyennement bien coloré. réactif aux soins. éveillé. gesticule. serre le doigt. tète la tétine. bouge la tête et les membres. calme, dort, détendu. réactif à la voix des parents. ouvre

2642 bété très réactif au toucher, mais calme. réagit au contact de ses parents.

 

Fichier Mktous.txt

Mot nÉLigne # Extrait Contenu Ligne

tous 153 1 très souvent (tous les jours), 2 souvent, 3 de temps en temps,

548 recherche le contact. pleure dans son incubateur. tire sur tous les fils. se calme quand on la prend dans les bras ou qu'on lui parle et la caresse. se promène dans son incubateur, très indépen

1293 la loi du 8 janvier 1993, tous les enfants nés vivants à

2374 recherche le contact. pleure dans son incubateur. tire sur tous les fils. se calme quand on la prend dans les bras ou qu'on lui parle et la caresse. se promène dans son incubateur, très indépen

Fichier Mkfatiguée.txt

Mot nÉLigne # Extrait Contenu Ligne

fatigu 518 endormie, passive, épuisée. bébé très attachant, calme, délicat. semble aussi très fatiguée, réagit peu lors des soins. semble même avoir du mal à garder ses paupières ouvertes. a besoin de cal

946 bébé plus calme aujourd'hui que les jours précédents en dehors des soins. par contre, pendant les soins, très réactif, très agité. tend et détend ses quatre membres vigoureusement. semble ne pa

1200 bébé très malade, fatigué + + +. douloureux au toucher (pleure).

1594 bébé plus calme aujourd'hui que les jours précédents en dehors des soins. par contre, pendant les soins, très réactif, très agité. tend et détend ses quatre membres vigoureusement. semble ne pa

2130 endormie, passive, épuisée. bébé très attachant, calme, délicat. semble aussi très fatiguée, réagit peu lors des soins. semble même avoir du mal à garder ses paupières ouvertes. a besoin de cal

2630 bébé très malade, fatigué + + +. douloureux au toucher (pleure).

fatigue 176 Comment vous sentez-vous aujourd'hui (moral, fatigue, etc.) 1 très

Fichier Mkétablit.txt

Mot nÉLigne # Extrait Contenu Ligne

Etablit 67 101 - Bébé réactif. - Etablit un contact au moment

Il faut noter que MKCorpus n'apprécie pas les accents, il nous faut donc utiliser les expressions régulières.

Soit : " fatigu.* " et " .tablit "

Voici les extraits des fichiers résultats obtenus sous Cordial :

Fichier contact.cnr

==== DEBUT DE PHRASE ====

0 \r157

1 157 0 157 0 NCMIN 1|1 M 1

2 je je PPER1S 2|2 S 1

3 ne ne ADV 4 Q 1

4 connais connaître VINDP1S 4 Q 1

5 pas pas ADV 4 Q 1

6 les le DETDPIG 7|7 D 1

7 parents parent NCMP 7|7 D 1

8 , , PCTFAIB 7|7 D 1

9 1 1 ADJNUM 11|11 N 1

10 bon bon ADJMS 11|11 N 1

11 contact contact NCMS 11|11 N 1

12 avec avec PREP 13|11 N 1

13 eux lui PPER3P 13|11 N 1

14 , , PCTFAIB 13|15 N 1

15 2 2 NCMIN 15|15 N 1

16 contact contact NCMS 15|15 N 1

===== FIN DE PHRASE =====

Fichier parents.cnr

==== DEBUT DE PHRASE ====

1 réactif réactif ADJMS - - 1

2 à à PREP 4 - 1

3 la le DETDFS 4 - 1

4 voix voix NCFIN 4 - 1

5 des de DETDPIG 6 - 1

6 parents parent NCMP 6 - 1

7 . . PCTFORTE - - 0

===== FIN DE PHRASE =====

Fichier tous.cnr

==== DEBUT DE PHRASE ====

1 tire tire NCFS 1 - 1

2 sur sur PREP 5 - 1

3 tous tout ADJMP 5 - 1

4 les le DETDPIG 5 - 1

5 fils fil NCMP 5 - 1

6 . . PCTFORTE - - 0

===== FIN DE PHRASE =====

Fichier fatiguée.cnr

==== DEBUT DE PHRASE ====

1 semble sembler VIMPP2S 4|4 M 1

2 aussi aussi ADV 4|4 M 1

3 très très ADV 4|4 M 1

4 fatiguée fatigué ADJFS 4|4 M 1

5 , , PCTFAIB 4|4 M 1

6 réagit réagir VINDP3S 6 V 1

7 peu peu ADV - t 1

8 lors des lors des PREP 9|9 H 1

9 soins soin NCMP 9|9 H 1

10 . . PCTFORTE - - 0

===== FIN DE PHRASE =====

Fichier établit.cnr

==== DEBUT DE PHRASE ====

0 \r

1 Etablit Etablit NPI 1 - 1

2 67 101 67 101 NCMIN 2 - 1

3 - - PCTFAIB 2 - 1

4 Bébé bébé NCMS 4 - 1

5 réactif réactif ADJMS 4 - 1

6 . . PCTFORTE - - 0

===== FIN DE PHRASE =====

==== DEBUT DE PHRASE ====

0 -

1 Etablit Etablit NPI 1 - 1

2 un un DETIMS 3 - 1

3 contact contact NCMS 3 - 1

4 au au DETDMS 5 - 1

5 moment moment NCMS 5 - 1

===== FIN DE PHRASE =====

 

 

 

 

 

 

 

 

 

 

Examen des patrons syntaxiques :

Voici la démarche appliquée pour l'étude des Patrons syntaxiques :

 

 

CORPREM.txt


MKCoprpu
s recherche de concordances Search string : forme recherchée

NPTools- one word

" MK-Forme recherchée.txt "


Cordial
étiquetage du corpus de la forme

" Forme recherchée.cnr "


Lexico3 récupération de fichiers permettant de construire et analyser les patrons syntaxiques.

Nous allons donc observer les différents types de patrons syntaxiques des mots choisis à partir des fichiers obtenus par Lexico3

 

On a pu remarquer que les mots étudiés se situent souvent dans le même environnement syntaxique.

Patrons syntaxiques

fatiguée

établit

tous

parents

contact

adv. + forme

Ä

       

Nc + adj. + Forme +Det +Nc

 

Ä

     

Sur +Forme +Det +Nc

   

Ä

   

Forme Det +Nc

   

Ä

   

adv. + Forme + Det + Nc

   

Ä

   

Nc + forme

     

Ä

 

Det + Forme

     

Ä

 

Avec + Det +Forme

     

Ä

Ä

V + Det + Forme + c.C. de temps

       

Ä

V + Forme + COI

       

Ä

Adj + Forme + COI

       

Ä

Forme + Adj

       

Ä

Adj + Forme

       

Ä

Pas de + Forme

       

Ä

V + Det + Forme

       

Ä

Forme + assez + Adj

       

Ä

Si on fait intervenir l'optionnalité, on peut simplifier ses patrons :

 

 

Patrons syntaxiques

fatiguée

établit

tous

parents

contact

adv. + forme

Ä

Ä

(adj.) + (adv.)+ prép.+ (Det) +Forme +(Det +Nc)

   

Ä

Ä

Ä

(Det)+ (Nc)+ (ADJ) + forme + (Det) + (Nc)

 

Ä

 

Ä

Ä

V + (Det) + Forme +( c. c. de temps)

       

Ä

V + Forme + COI

       

Ä

adj. + Forme + COI

       

Ä

Forme + assez + adj.

       

Ä

Nous pourrions simplifier encore mais cela nous permet déjà de bien voir les différents patrons syntaxiques que l'on peut rencontrer dans ce corpus autour des mots étudiés.

Légende :

ADV : adverbe adj. : adjectif Nc : Nom commun

Det : Déterminant prép. : préposition V : Verbe

Forme : mot étudié parmi les 5

Ä  : forme qui se retrouve dans l'un de ses patrons

( ) : l'optionalité des éléments

 

Segments répétés :

Pour faire l'étude des segments répétés, nous avons soumis le corpus étiqueté à Lexico puis activer la fonction " segment répété ".

Le logiciel crée un fichier des concordances des structures que l'on retrouve le plus dans le corpus. Les seuls segments qui contiennent des mots choisis pour notre analyse sont ceux contenant " contact ".

Extraits de Résultats :

Corpus : cordial2lexico

Date : vendredi 26 janvier 2001 - 11:33

Concordance de : bon contact

(tri ordre du texte)

eux . gigotte beaucoup . très mignonne . bon contact . Jour 15 détendue , bien réactive

ue . présente pendant les soins . Jour 7 bon contact . ouvre les yeux . fait des petits

agit peu lors des soins . bébé tonique . bon contact . réagit aux soins . ouvre les yeux

gigoteur . regarde autour de lui . très bon contact . agité . Corpus Prématurés 1996

ère 10 Bébé 12 Jour 0 / 2 bébé tonique . bon contact . réagit aux soins . ouvre les yeux

gigoteur . regarde autour de lui . très bon contact . agité . Bébé 13 Jour 3 / 3 bébé

eux . gigotte beaucoup . très mignonne . bon contact . Bébé 8 Jour 0 / 1 bébé calme ,

te pendant les soins . Bébé 8 Jour 7 / 1 bon contact . ouvre les yeux . fait des petits

es ) 0 je ne connais pas les parents , 1 bon contact avec eux , 2 contact moyen , 3 mauvais

e yeu . gigotte beaucoup . très mignon . bon contact . jour 15 détendu , bien réactiver

nique . présent pendant le soin . jour 7 bon contact . ouvrer le yeu . fait un petit

éagir peu lors des soin . bébé tonique . bon contact . réagir au soin . ouvrer le yeu

gigoteur . regarder autour de lui . très bon contact . agité . corpus prématuré 1996

ier 10 bébé 12 jour 0 / 2 bébé tonique . bon contact . réagir au soin . ouvrer le yeu

gigoteur . regarder autour de lui . très bon contact . agité . bébé 13 jour 3 / 3 bébé

e yeu . gigotte beaucoup . très mignon . bon contact . bébé 8 jour 0 / 1 bébé calme ,

sent pendant le soin . bébé 8 jour 7 / 1 bon contact . ouvrer le yeu . fait un petit

te ) 0 je ne connaître pas le parent , 1 bon contact avec lui , 2 contact moyen , 3 mauvais

contact avec

(tri ordre du texte)

déjà ouvert les yeux . prend et cherche contact avec ses mains lorsqu ' on le touche ( s

déjà ouvert les yeux . prend et cherche contact avec ses mains lorsqu ' on le touche ( s

déjà ouvert les yeux . Prend et cherche contact avec ses mains lorsqu ' on le touche 101

0 je ne connais pas les parents , 1 bon contact avec eux , 2 contact moyen , 3 mauvais contact

déjà ouvert les yeux . prend et cherche contact avec ses mains lorsqu ' on le touche s '

déjà ouvrir le yeu . prendre et chercher contact avec son main lorsque on le toucher ( se

déjà ouvrir le yeu . prendre et chercher contact avec son main lorsque on le toucher ( se

déjà ouvrir le yeu . prendre et chercher contact avec son main lorsque on le touche 101 se

0 je ne connaître pas le parent , 1 bon contact avec lui , 2 contact moyen , 3 mauvais contact

déjà ouvrir le yeu . prendre et chercher contact avec son main lorsque on le toucher se aggrippe

de contact

(tri ordre du texte)

ins . Jour 3 très endormi . aréactif pas de contact . se laisse faire . Jour 7 bébé

tion timide à la douleur . impossibilité de contact . sédaté car douloureux . résiste

ques réactions au moment des soins . pas de contact actuellement . Jour 3 petite puce

ables tels qu ' aspiration ou dextro peu de contact . ne tète pas beaucoup le doigt

jambes et ses bras . bébé sans vraiment de contact . Jour 7 bébé qui dort entre les

jambes et ses bras . bébé sans vraiment de contact . Bébé 10 Jour 7 / 1 bébé qui dort

ques réactions au moment des soins . pas de contact actuellement . Bébé 7 Jour 3 / 3

ables tels qu ' aspiration ou dextro peu de contact . ne tète pas beaucoup le doigt

tion timide à la douleur . impossibilité de contact . Bébé 3 Jour 3 / 2 détendue , calme

2 Jour 3 / 1 très endormi . aréactif pas de contact . se laisse faire . Bébé 8 Jour

oin . jour 3 très endormi . aréactif pas de contact . se laisser faire . jour 7 bébé

tion timide à le douleur . impossibilité de contact . sédaté car douloureux . résister

uper de lui . ne ouvrer pas le yeu . peu de contact . dormir . ne bouger pas . aréactif

uelque réaction au moment des soin . pas de contact actuellement . jour 3 petit puce

gréable tel que aspiration ou dextro peu de contact . ne téter pas beaucoup le doigt

n jambe et son bras . bébé sans vraiment de contact . jour 7 bébé qui dormir entre

le contact

(tri ordre du texte)

l ' incubateur . se déplace . recherche le contact . pleure dans son incubateur . tire

ule beaucoup , ouvre les yeux et cherche le contact . écoute la voix , n ' aime pas

ule beaucoup , ouvre les yeux et cherche le contact . écoute la voix , n ' aime pas

à la voix . Bébé 3 Jour 15 / 2 recherche le contact . pleure dans son incubateur . tire

le incubateur . se déplacer . rechercher le contact . pleurer dans son incubateur .

ler beaucoup , ouvrer le yeu et chercher le contact . écouter le voix , ne aimer pas

bébé qui dormir entre le soin , refuser le contact , pleurer quand on le toucher pour

ler beaucoup , ouvrer le yeu et chercher le contact . écouter le voix , ne aimer pas

bébé qui dormir entre le soin , refuser le contact , pleurer quand on l

L'articulation des différents outils ( emacs, cordial÷) nous facilite un peu le travail mais pour répondre aux questions il nous faut faire un travail manuel car le texte n'est pas étiqueté de façon adéquate pour notre travail.

 

 

 

 

Programmes sous PERL :

Le but de cette étape est de créer des programmes qui vont effectuer les recherches suivantes dans notre corpus :

Pour cela nous avons construit les programmes sous Emacs puis nous avons afficher les résultats obtenus dans des fichiers resu.txt.

Pour construire les programmes nous avons d'abord recherché dans le corpus les balises qui structurent les pages, les liens et les parties textuelles.

Ainsi nous avons déterminé les balises qui permettent de repérer :

 

  1. le programme :

Sous Emacs :

#!/usr/local/bin/perl/

open (FILE, "$ARGFV[0]");

Ouverture du fichier à analyser, ici CORPREM

open (resu1, ">>page.txt");

open (resu2, ">>lien.txt");

open (resu, ">>txtbrut.txt");

ouverture des fichiers dans lesquels on veut mettre nos résultats obtenus.

$numpage=0;

$numlien=0;

On incrémente les valeurs initiales de calcul.

while ($ligne=<FILE>){

On ouvre une boucle qui dit " tant que le fichier en lecture contient des lignes, celles-ci seront lues et incrémentées à la variable $ligne "."

if ($ligne=~/\<SITEFileName\>/){

On fait un test de recherche de balise "  si la ligne contient la balise recherchée÷ "

$numpage++;

÷on ajoute +1 à la valeur de $numpage et÷

}

÷après avoir fermé le bloc if÷

print resu1 "$numpage : $ligne\n";

On imprime dans le fichier résultat le numéro et la ligne trouvés.

}

fermeture du bloc While

while ($ligne=<FILE>){

if ($ligne=~/\<tagHTMLAttrTAG=".*"NUM="[0-9]"ATTRTy="href" VALUE=".*\/.*\/.*\/\>/){

$numlien++;

}

print resu2 "$numlien : $ligne\n";

}

while ($ligne=<FILE>){

if ($ligne=~/SITEFileTxtBrut/){

print resu "$ligne \n ";

On imprime dans le fichier résultat, ce que contient ^ligne puis on ajoute un retour chariot pour aérer le résultat.

}

}

close FILE;

close resu1;

close resu2;

close resu;

On ferme tous les fichiers ouverts .

 

II) Nouvelle version du Corpus :

Voici le corpus obtenu via XMLSpy :

<?xml version="1.0" encoding="ISO-8859-1"?>

<!DOCTYPE bebeprema SYSTEM "C:\TAL\corpusprema.dtd">

<bebeprema>

<title>Premature96</title>

<date>novembre 1998</date>

<encodingcorpus>

<bebe num="1">

<jour num="0">

<infirmiere num="3">bébé réactif. établit un contact au moment des soins. bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement. a déjà ouvert les yeux. prend et cherche contact avec ses mains lorsqu'on le touche (s'aggrippe au doigt).</infirmiere>

<infirmiere num="12">tonique aux soins. réactif. calme en dehors des soins. détendu au bain.</infirmiere>

</jour>

<jour num="3">

<infirmiere num="23">calme. détendu. tétouille sa sonde en dormant. attachant.</infirmiere>

<infirmiere num="19">c'est une petite fille mignonne avec beaucoup de cheveux, qui lorsqu'elle est réveillée est très tonique, bouge beaucoup et pleure beaucoup. elle paraît plus vieille que son terme. lorsque je lui parle, elle ouvre les yeux et semble attentive au son de la voix</infirmiere>

</jour>

<jour num="7">

<infirmiere num="23">détendue, calme, sage. mais manifeste son mécontentement lorsque je lui fais ses soins. cherche à téter. tourne sa tête, se positionne, se niche. bébé agréable, attachant.</infirmiere>

<infirmiere num="7">bébé tonique et dynamique. très accrocheur. suit des yeux et ne lache pas. exigeante, elle manifeste jusqu'à ce que j'ai mis en place la situation qui lui convient (couverture ou tétine). bébé détendu, souriant. sait créer une interaction forte avec ses parents ou l'infirmière.</infirmiere>

<infirmiere num="13">tonique. éveillée. s'exprime suivant les situations (soins, câlins). regarde quand on lui parle. jolie. agréable de s'en occuper. attachante. fait des mimiques. prend des positions pour dormir assez risibles. détendue quand elle dort. petite poupée avec de jolis cheveux noirs assez fournis. harmonie du corps. un peu mate de peau.</infirmiere>

</jour>

</bebe>

<bebe num="2">

<jour num="0">

<infirmiere num="1">bébé très sédaté. beau bébé, harmonieux, mais très malade. bébé très marbré, violet.</infirmiere>

<infirmiere num="13">hypotonique. aréactif. mauvais teint. labile. sensible au toucher lors des soins. grimaces lors des soins.</infirmiere>

</jour>

<jour num="3">

<infirmiere num="24">très endormi. aréactif. pas de contact. se laisse faire.</infirmiere>

</jour>

<jour num="7">

<infirmiere num="5">bébé douloureux, fait la grimace quand on s'occupe de lui, cela est sa seule expression. ne bouge aucun des membres, n'ouvre pas les yeux. paraît triste, a souvent les yeux larmoyants. mauvaise couleur : bleu vert. s'abîme beaucoup au niveau des téguments.</infirmiere>

<infirmiere num="13">douloureux. endormi. mauvaise couleur. grimaces aux soins. réactif aux soins. labile. bouge spontanément en dehors des soins. se laisse faire. impressionnant à voir.</infirmiere>

<infirmiere num="21">enfant sédaté, endormi. pâle, infecté, oedématié, raide. mâchonne ? réaction timide à la douleur. impossibilité de contact.</infirmiere>

<infirmiere num="4">sédaté car douloureux. résiste aux différentes épreuves. attend l'arrivée de sa mère pour partir ?</infirmiere>

</jour>

</bebe>

<bebe num="3">

<jour num="3">

<infirmiere num="12">calme, très détendue. réactive aux soins. prend des positions très cool. </infirmiere>

<infirmiere num="21">détendue, calme. réactive aux soins. dort ! indépendante.</infirmiere>

</jour>

<jour num="7">

<infirmiere num="22">bébé bien tonique, voire très excitable. ouvre bien les yeux. gigotte beaucoup. très mignonne. bon contact.</infirmiere>

</jour>

<jour num="15">

<infirmiere num="12">détendue, bien réactive, attentive aux soins. tonique, mais calme. fait sa vie dans l'incubateur. se déplace. </infirmiere>

<infirmiere num="14">recherche le contact. pleure dans son incubateur. tire sur tous les fils. se calme quand on la prend dans les bras ou qu'on lui parle et la caresse. se promène dans son incubateur, très indépendante, fait ce qu'elle veut, refuse les soins (se débat, hurle). très coléreuse et très câline. beaucoup de caractère, qui sait ce qu'elle veut. chipie, très attentive et réceptive.</infirmiere>

</jour>

</bebe>

<bebe num="13">

<jour num="0">

<infirmiere num="15">petit bout très mignon, tonique. bien proportionné. pleure + +. gesticule.</infirmiere>

<infirmiere num="2">bébé calme et détendu. dort en denors des soins. pleure et gigote au moment des soins. </infirmiere>

<infirmiere num="18">bébé très malade, fatigué + + +. douloureux au toucher (pleure).</infirmiere>

</jour>

<jour num="3">

<infirmiere num="18">bébé très endormi (sous Fentanyl et Hypnovel).</infirmiere>

<infirmiere num="14">bébé endormi, sous Hypnovel. réagit plus ou moins aux soins. aucun contact car dort + + +.</infirmiere>

<infirmiere num="18">va mieux. toujours sédaté, mais plus réceptif au toucher.</infirmiere>

</jour>

<jour num="7">

<infirmiere num="3">petit bébé calme. ouvre les yeux pendant les soins. semble vouloir tourner la tête de mon côté. semble écouter ce que je lui dis. reposé. n'est pas crispé pendant les soins.</infirmiere>

<infirmiere num="14">bété trés tonique, réagit aux soins, très remuant, ne tient pas en place. sous photo., donc lunettes, ne voit rien, mais réagit à la voix.</infirmiere>

</jour>

</bebe>

</encodingcorpus>

</bebeprema>

 

 

La DTD générée par XMLSpy :

<?xml version="1.0" encoding="UTF-8"?>

<!-- edited with XML Spy v3.0.7 (http://www.xmlspy.com-->

<!--DTD generated by XML Spy v3.0.7 (http://www.xmlspy.com)-->

<!ELEMENT bebe (jour+)>

<!ATTLIST bebe

num (1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13) #REQUIRED

>

<!ELEMENT bebeprema (title, date, encodingcorpus)>

<!ELEMENT date (#PCDATA)>

<!ELEMENT encodingcorpus (bebe+)>

<!ELEMENT infirmiere (#PCDATA)>

<!ATTLIST infirmiere

num (1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25) #REQUIRED

>

<!ELEMENT jour (infirmiere+)>

<!ATTLIST jour

num (0 | 3 | 7 | 15) #REQUIRED

>

<!ELEMENT title (#PCDATA)>

 

Ainsi on peut obtenir l'étiquetage suivant :

Mot n°Ligne # Extrait Contenu Ligne

contact 9 <infirmiere num="3">bébé réactif. établit un contact au moment des soins. bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement. a déjà ouvert les ye

9 <infirmiere num="3">bébé réactif. établit un contact au moment des soins. bébé attachant de par son histoire, mais aussi son physique, son apparence et son comportement. a déjà ouvert les ye

28 <infirmiere num="24">très endormi. aréactif. pas de contact. se laisse faire.</infirmiere>

33 <infirmiere num="21">enfant sédaté, endormi. pâle, infecté, oedématié, raide. mâchonne ? réaction timide à la douleur. impossibilité de contact.</infirmiere>

43 <infirmiere num="22">bébé bien tonique, voire très excitable. ouvre bien les yeux. gigotte beaucoup. très mignonne. bon contact.</infirmiere>

47 <infirmiere num="14">recherche le contact. pleure dans son incubateur. tire sur tous les fils. se calme quand on la prend dans les bras ou qu'on lui parle et la caresse. se promène dans son

58 <infirmiere num="14">bébé endormi, sous Hypnovel. réagit plus ou moins aux soins. aucun contact car dort + + +.</infirmiere>