Extraction de patrons sur la sortie au format XML (via Treetagger) issue de Boîte à outils Série 2 via un script perl utilisant la bibliothèque XML::XPath
- L’arborescence du fichier de tags en entrée du script d'extraction doit être celle produite par le script treetagger2xml.pl, comme dans cet exemple.
- Le nombre de motifs recherchés est laissé au libre choix de l’utilisateur, dans notre fichier exemple nous avons deux motifs : "NOM PRP NOM" et "NOM ADJ".
- Le script stocke les résultats obtenus pour chaque motif dans un fichier différent, par exemple pour le motif "NOM ADJ".