Secteur TAL Informatique
ILPGA Université Paris 3
Parcours TAL : step 1
Introduction
Présentation du corpus
Le corpus Prématurés a été réuni en 1996-97 dans un service de réanimation néo-natale pour l'exploration des compétences relationnelles du prématuré né à moins de 30 semaines d'aménohrrée dans une unité de réanimation néonatale. C'est un corpus-maquette portant sur 13 bébés et destiné à mettre au point le protocole de l'expérimentation qui sera effectuée en 1999.
Pour une présentation complète du projet, lire le texte Présentation générale.
Présentation des versions textuelles
Plusieurs versions sont utilisables :
- la première, brute (p96.tab), est issue d'un tableur (un tableur manipule des cellules organisées en lignes et colonnes, et permet de faire calculer la valeur d'une cellule à partir du contenu d'une ou de plusieurs autres cellules). C'est la version qui a été constitué dans le service de réanimation néonatale à partir des fiches papier remplies par les infirmières. Dans ce fichier, le nombre débutant la ligne concatène le numéro de bébé, celui du jour de l'observation et celui de l'observation dans la journée.
- la seconde (p96.bal) nomme les différentes informations contenues dans une fiche sur un bébé un jour donné à un moment déterminé.
- On dispose aussi de (p96.fic) qui regroupe toutes les fiches.
- Enfin, on dispose de (p96.tag) qui correspond à une version étiquetée du corpus bébé
La seconde version (p96.bal) est disponible (au format HTML) : visualisation p96bal.htm.
La première version (p96.tab)
est disponible (au format TXT) : visualisation p96.tab.
La seconde version (p96.bal)
est disponible (au format TXT) : visualisation p96.bal.
La version (p96.fic)
est disponible (au format TXT) : visualisation p96.fic.
La version (p96.tag)
est disponible (au format TXT) : visualisation p96.tag.
Pour la visualisation des versions textuelles brutes, une étape de téléchargement
est parfois nécessaire.
Si tel est le cas placer le fichier cherché dans votre environnement de travail avant de le manipuler.
Présentation de la version hypertextuelle
Navigation et HTML
Les principes de la navigation hypertextuelle sont présentés dans le document associé au lien précédent !
Pour une présentation du langage HTML, on se reportera aux documents présentés sur le site TAL-Paris3.
La première partie du TP1 est un exercice de construction de page HTML.
Lecture du corpus Prématurés
Le point d'entrée est fourni sur la page de sommaire. On peut y trouver les informations suivantes :
- la présentation générale du corpus
- les précisions sur l'état de départ du corpus
- les indications sur la prématurité
- par bébé (avec indication du jour et de l'observation) ;
- par infirmière ;
- catégorisé par un étiqueteur avec les catégories mises en évidence par des changements de couleur (visualisables ou non selon la machine utilisée) ou par des changements de police (gras, italiques, etc.).
Vous pouvez ensuite commencer à traiter le TP1.