MKCORPUS PROJECT MKCORPUS PROJECT MKCORPUS PROJECT
MKC Home
 

 

MkCorpus/CorpusPlusBuilder...

Module : make corpus tag

S. Fleury

01/07/2001

Ce programme traite un corpus XML issu de la chaîne webxref-038 et construit un corpus pour Lexico3 contenant uniquement des balises HTML préalablement sélectionnées.

Ce programme prend en arguments 3 paramètres :

1. Le répertoire de sortie des résultats

2. Le corpus XML de travail

3. Le fichier des balises HTML sélectionnées et à extraire du corpus XML

 

Dans la fenêtre de lancement du programme il faut donc donner :

Dir Input : le chemin du répertoire contenant le corpus XML (terminé par /)

CorpusXMLName : le nom du fichier/corpus XML

Selected Markup FileName : le nom du fichier contenant les balises sélectionnées. Ce fichier est composé de la manière suivante :

TAG1tabulationX

TAG2tabulationY

TAG1 et TAG2 sont des balises HTML, suivies d'une tabulation, puis d'une valeur numérique (X, Y).

Dir Output : le chemin du répertoire de sortie (terminé par /)