L6T051 - TAL pour Linguistes - Matias Calderon

Utilisation de Perk TK

On va voir dans cette partie du cours, l'utilisation de Perl TK

On a commencé tout d'abord par la création d'un logiciel qui est téléchargeable ici

1) Dans ce logiciel, on doit donc commencer par charger un texte, comme par exemple ici où on a chargé le texte du site internet de l'ilpga. Il faut tout d'abord mettre le lien du site en URL et ensuite cliquer sur LOAD-URL

2) On obtient donc ceci après avoir cliqué sur LOAD-URL

3) En cliquant sur URL2txt, on obtient donc le texte du site internet

4) En cliquant ensuite sur l'onglet "Dictionnaire", on peut voir que le logiciel a crée un dictionnaire avec les occurrences du site

5) On peut par exemple sélectionner deux mots (ou plus) pour chercher une concordance de ces mots avec leurs contextes gauches et droits. Ici nous avons sélectionné le mot "administratif" et "Administration" pour réaliser une concordance en appuyant sur le bouton "Concordance"

6) On obtient donc un contexte par chaque mot

7) En cliquant sur le bouton "Syntax", on peut d'une part cliquer sur treetagger, logiciel qui sert à donner de catégories grammaticales au texte. On obtient donc le résultat suivant :

8) Et si on clique à nouveau sur "Syntax", et qu'on clique ensuite sur "extraction patrons N + ADJ", on va prendre les catégories grammaticales définies par treetagger, pour ensuite obtenir seulement la suite "N + ADJ". On peut faire de même pour "DET+NOM+VERBE". On obtient donc ceci comme résultat :