Boîte à outil 3

Extraction de patrons morphosyntaxiques et de relations en dépendance syntaxique

On réalise deux types d'activité dans cette dernière partie du travail. Dans un premier temps, on extrait des patrons morphosyntaxiques, puis dans un second temps des relations en dépendance syntaxique de type "objet". Chacune de ces étapes est effectuée avec trois méthodes différentes: un script perl, des requêtes xquery et des feuilles de style xslt. L'extraction des patrons morphosyntaxiques avec le programme perl est réalisée à partir des étiquetages produits avec Udpipe (sorties xml). L'extraction des patrons avec Xquery et les feuilles de style xslt est réalisée à partir des étiquetages produits avec Treetagger (sorties xml). L'extraction en dépendance avec ces trois méthodes est appliquée sur les sorties Udpipe au format xml. Ces méthodes sont résumées dans le graphique suivant:



image