Bao 3 - 3 | Xquery

Objectif :

L’objectif de cette troisième boîte à outils est de parcourir les fichiers étiquetés par TreeTagger et UdPipe générés lors de la BàO2 et d'en extraire des patrons morpho-syntaxiques via différentes méthodes de traitement automatique. Ici nous utiliserons la méthode Xquery.

XQuery est un langage de requête informatique permettant non seulement d'extraire des informations d'un document XML, ou d'une collection de documents XML, mais également d'effectuer des calculs complexes à partir des informations extraites et de reconstruire de nouveaux documents ou fragments XML.

Les 4 patrons morpho-syntaxiques à extraire obligatoires sont les suivants :

  • NOM PREP NOM PREP
  • VERBE DET NOM
  • NOM ADJ
  • ADJ NOM

Les 2 patrons morpho-syntaxiques choisis par nos soins sont les suivants :

  • NOM PREP ADJ
  • PREP DET NOM

Voici les requêtes Xquery :

ADJ-NOM

NOM-ADJ

NOM-PREP-ADJ

NOM-PREP-NOM-PREP

PREP-DET-NOM

VERB-DET-NOM



Résultats :

Rubrique ADJ NOM NOM ADJ NOM PREP ADJ NOM PREP NOM PREP PREP DET NOM VERBE DET NOM
A la une (3208) sortie sortie sortie sortie sortie sortie
Société (3224) sortie sortie sortie sortie sortie sortie
Culture (3246) sortie sortie sortie sortie sortie sortie
Cinéma (3476) sortie sortie sortie sortie sortie sortie

La relation de dépendance à extraire est la relation 'obj' :

Voici un exemple de requête pour trouver la relation objet.

OBJ

Rubrique OBJ
A la une (3208) sortie
Société (3224) sortie
Culture (3246) sortie
Cinéma (3476) sortie