Bao 3 - 3 | Xquery
Objectif :
L’objectif de cette troisième boîte à outils est de parcourir les fichiers étiquetés par TreeTagger et UdPipe générés lors de la BàO2 et d'en extraire des patrons morpho-syntaxiques via différentes méthodes de traitement automatique. Ici nous utiliserons la méthode Xquery.
XQuery est un langage de requête informatique permettant non seulement d'extraire des informations d'un document XML, ou d'une collection de documents XML, mais également d'effectuer des calculs complexes à partir des informations extraites et de reconstruire de nouveaux documents ou fragments XML.
Les 4 patrons morpho-syntaxiques à extraire obligatoires sont les suivants :
- NOM PREP NOM PREP
- VERBE DET NOM
- NOM ADJ
- ADJ NOM
Les 2 patrons morpho-syntaxiques choisis par nos soins sont les suivants :
- NOM PREP ADJ
- PREP DET NOM
Voici les requêtes Xquery :
ADJ-NOM
NOM-ADJ

NOM-PREP-ADJ

NOM-PREP-NOM-PREP

PREP-DET-NOM

VERB-DET-NOM

Résultats :
Rubrique | ADJ NOM | NOM ADJ | NOM PREP ADJ | NOM PREP NOM PREP | PREP DET NOM | VERBE DET NOM |
---|---|---|---|---|---|---|
A la une (3208) | sortie | sortie | sortie | sortie | sortie | sortie |
Société (3224) | sortie | sortie | sortie | sortie | sortie | sortie |
Culture (3246) | sortie | sortie | sortie | sortie | sortie | sortie |
Cinéma (3476) | sortie | sortie | sortie | sortie | sortie | sortie |
La relation de dépendance à extraire est la relation 'obj' :
Voici un exemple de requête pour trouver la relation objet.
OBJRubrique | OBJ |
---|---|
A la une (3208) | sortie |
Société (3224) | sortie |
Culture (3246) | sortie |
Cinéma (3476) | sortie |