Remarques méthodologiques
Un texte balisé
- n ’est pas fait pour être lu
- mais pour être manipulé par des outils de traitements particuliers
- les balises HTML sont utilisées par les navigateurs pour gérer l ’affichage d ’une page HTML
On peut utiliser des logiciels
- pour extraire des fragments de texte relevant d ’un type donné :
- sur des email, extraire les émetteurs, les destinataires…
- sur un dictionnaire, extraire les définitions, les usages...