PROJET ENCADRÉ


Accueil Mots BAO I BAO II BAO III

BAO N° III

Résultant des boîtes à outils n° 1 et n° 2, le BAO n°3 a pour soubassement d’extraire les patrons dans les fichiers que nous avons générés avec la boîte à outil numéro 2.

Il nous est demandé d’extraire quatre patrons allant de deux catégories grammaticales à quatre. Dans le cours projet encadré des classes grammaticales étaient proposées, toutefois, nous avons décidé de choisir d’autres classes :

  • NOM ADJ
  • ADJ NOM
  • VERB DET NOM
  • DET NOM ADJ
  • DET NOM VERB NOM
  • DET NOM VERB ADV

L’extraction des patrons sont obtenus à partir des fichiers treetagger et udpipe générés dans la boîte à outil n° 2.

Lancer le script

Tree-Tagger : perl bao3.pl -p treetagger_sortie.xml extraction Tree_patrons-VERB-DET-NOM.txt -m VERB DET NOM

UDPipe : perl bao3.pl -p udpipe_sortie.txt Udpatron_D-N-V-N.txt -u -m DET NOUN VER NOUN

SCRIPT

Texte source Udpipe (International) Patrons (ADJ NOM) Patrons (NOM ADJ) Patrons (VERB DET NOM) Patrons (DET NOM VERB NOM)

Texte source Treetagger (International) Patrons (NOM ADJ) Patrons (ADJ NOM) Patrons (DET NOM ADJ) Patrons (DET NOM VERB ADV)