Retour Partie 2

XML Structuré

Construire des entrées de dictionnaire :

Avant de pouvoir construire un document structuré, il a fallu trouver un certain nombre de données.
Nous avons alors choisi une dizaine de mots dans le tlf(Trésor de la langue française, un dictionnaire que l'on peut notamment trouver en ligne). Ici, il s'agit de dix noms de métier (paléontologue, orthophoniste, botaniste, coiffeur, juriste, apiculteur, informaticien, linguiste, plombier et dentiste). Si l'on cherche l'un de ces mots dans le tlf, voici ce que l'on obtient :

A partir de là, nous avons essayé de comprendre l'organisation des données dans un dictionnaire.
Et quoi de mieux qu'un schéma pour comprendre l'arborescence trouvée ?

Nous remarquerons que les noms colorés en rouge sont les éléments qui peuvent apparaître, ou qui apparaissent plus d'une fois, tandis que les noms colorés en vert sont les éléments optionnels, qui peuvent éventuellement ne pas apparaître.

A partir de là, il a fallu élaborer une structure xml, dont voici un extrait :

Ainsi, comme vous le voyez, ce dictionnaire est découpé en plusieurs articles, qui contient plusieurs éléments principaux - l'entrée, le sens actuel, l'étymologie... Eux mêmes divisés ou non en d'autres éléments, suivant l'arborescence pré établie que nous avons montré plus haut.


Bien sûr, pour comprendre plus facilment ce document, on y associe une "grammaire", la DTD(Document Type Definition), qui donne les règles de l'arborescence xml.


Exemple XML Firefox

On peut ensuite visualiser le résultat via un navigateur internet, Firefox dans notre cas.