makeCorpusTAGForLexico-038
Format d'entrée :
- Le programme makeCorpusTagForLexico.pl prend en entrée le corpus XML issu de webxref et génère un corpus qui contient uniquement les balises HTML en gardant l'identification du site et de la page concernée
Format de sortie :
- le programme crée en sortie un corpus contenant les TAGs HTML, le corpus est formaté pour Lexico3