Retour à Modélisation XML

XML Structuré

Les noms d'oiseaux en question sont l'accenteur mouchet, le bruant zizi, la foulque macroule, la linotte mélodieuse, l'outarde barbue, la pie bavarde, la sitelle torchepot, le torcol fourmilier, le traquet motteux et le troglodyte mignon.

oiseaugif

L'arborescence établie pour structurer les informations sur ces charmants volatiles n'est pas la même que celle choisie dans un dictionnaire (catégorie grammaticale, sens, exemples...) car elle concerne des éléments de même type (des oiseaux), et il serait donc redondant d'y faire apparaître une étiquette "catégorie" par exemple, qui porterait toujours l'information "nom".

En revanche, cette classification peut être intéressante :


arbopiaf


(Les informations qui ne sont pas toujours connues/précisées pour certains oiseaux figurent au bout d'une "branche en pointillés")

Les informations sur chaque oiseau proviennent du site oiseau.net, elles ne sont donc pas structurées et figurent dans des paragraphes de texte ou des encarts. Un ordinateur ne peut les distinguer dans cette configuration. Une fois extraites, la création d'un fichier XML et de sa DTD est possible, et le logiciel utilisé ici est TextWrangler.

oiseauxnet

oiseaugif

Ainsi la représentation en langage XML prend cette forme-là : (fichier téléchargeable ici)

piafxml

Et la DTD qui accompagne ce fichier prend cette forme-ci : (fichier téléchargeable ici)

piafdtd


Après vérification sur le site http://www.hitsw.com/xml_utilites/ la DTD correspond bien à l'organisation du fichier XML.

oiseaugif