Remarques préliminaires
Un texte balisé n ’est pas fait pour être lu mais pour être manipulé par des outils de traitements particuliers
- les balises HTML sont utilisées par les navigateurs pour gérer l ’affichage d ’une page HTML
- on peut utiliser des logiciels pour extraire des fragments de texte relevant d ’un type donné :
- sur une bibliographie, extraire les dates, les auteurs…
- sur un dictionnaire, extraire les définitions, les usages...