1. Rubrique 3208 2020 étiquetée avec treetagger

Fichier de travail :

Partie1 : XSLT

Ligne de commande pour lancer le programme :
xsltproc fichier.xsl fichier.xml > sortie.txt ou html

Q1 : Construire une feuille de styles pour afficher les contenus étiquetés avec TreeTagger

Q2 : Construire des feuilles de style pour extraire (au format TXT) au moins 3 patrons morpho- syntaxiques (de longueurs différentes) sur les mêmes fichiers

Q3 : Construire une feuille de styles pour afficher les contenus étiquetés avec TreeTagger en mettant au jour un patron morphosyntaxique.

Partie 2: Xquery (via BASEX)

Requêtes pour Q1-Q5:

Q1 : Construire une requête pour extraire les contenus textuels des titres

Q2 : Construire une requête pour extraire les contenus textuels des descriptions

Q3 : Construire une requête pour extraire les contenus textuels des titres ET des descriptions

Q4 : Construire une requête pour extraire les patrons morpho-syntaxiques NOM ADJ

Q5 : Construire une requête pour extraire les patrons morpho-syntaxiques NOM PRP NOM

2. Rubrique 3208 2020 étiquetée via udpipe

Fichier de travail :

Partie1 : XSLT

Ligne de commande pour lancer le programme :
xsltproc fichier.xsl fichier.xml > sortie.txt ou html

Q1 : Construire une feuille de styles pour afficher les contenus étiquetés avec TreeTagger

Q2 : Peut-on envisager de construire une feuille de styles pour afficher chaque « titre » en regard de sa « description » : par exemple un tableau avec 2 colonnes, à gauche les titres et à droite les descriptions (un alignement en somme) ? si cela n’est pas possible directement, quel est l’alignement minimal que l’on peut mettre en œuvre ? Construire cet alignement minimal

Reponse : J'arrive à afficher chaque titre avec sa description mais ils ne sont pas alignés en somme.

Q3: Construire des feuilles de style pour extraire (au format TXT) au moins 3 patrons morpho- syntaxiques (de longueurs différentes) sur les « titres » uniquement puis sur les « descriptions » uniquement

Q4: Construire une feuille de styles pour afficher les contenus étiquetés en mettant au jour un patron morphosyntaxique (NOM PREP NOM) sur les « titres » uniquement puis sur les « descriptions » uniquement

Q5 : Construire une feuille de styles pour extraire (au format TXT) les items en relation de dépendance syntaxique de type OBJ (les classer et les compter). Essayer de tenir compte de la différence titre/description

Q6 : Construire une feuille de styles pour extraire la liste des POS en relation de dépendance syntaxique de type OBJ (les classer et les compter)

Partie 2: Xquery (via BASEX)

Requêtes pour Q1-Q7:

Q1 : Construire une requête pour compter le nombre de titres, le nombre de descriptions.

Q2 : Construire une requête pour extraire les contenus textuels des « titres ».

Q3 : Construire une requête pour extraire les contenus textuels des « descriptions »

Q4 : Construire une requête pour extraire les contenus textuels des titres ET des descriptions

Q5 : Construire une requête pour extraire au moins 3 patrons morpho-syntaxiques (de longueurs différentes) : NOM ADJ, NOM VERBE NOM, NOM PREP NOM NOM

Q6 : Construire une requête pour extraire les items portant une relation de dépendance syntaxique de type OBJ

Q7 : Construire une requête pour les items en relation de dépendance syntaxique de type SUB (on affichera les formes ou les lemmes connectés par cette relation)