Programmation en perl

L'extracteur

Dans cette partie, je vous propose de visualiser le script qui m'a permis de réaliser l'extracteur puis, dans un deuxième temps, je vais vous proposer des captures d'écran vous montrant le résultat. 

Si vous voulez directement  visualiser une étape, cliquez dessus :
-Le script
-L'interface de base
-Linterface commentée
-Résultat de la page web avec les balises / sans les balises
-La barre de recherches
-Le dictionnaire des occurrences
-La concordance
-Treetagger
-L'extraction de patrons syntaxiques du type Nom/adj
-Le rapport
-Le manuel


++ Le script :

Cliquez ici

++ L'interface :
 interface

++ L'interface commentée :
interface2

++ Si vous voulez travailler sur une page web, rentrez dans la barre de saisie url l'adresse du site, puis appuyer sur Load URL une fois que vous avez fait ceci voici ce qui apparait :

1>> Ici, le contenu de la page s'affiche avec toutes les balises HTML. Pour enlever les balises et n'obtenir que le texte brut, pressez URL2txt. Vous obtiendrez ceci :

2

Dans cette page, vous pouvez rechercher des occurrences en vous servant de la barre de recherche. Une fois trouvés, les mots clignotent dans le texte.

++ Aperçu du dictionnaire des occurrences (triées par ordre alphabétique)  de ce texte :

3
Pour obtenir une concordance, il suffit de sélectionner un ; ou plusieurs mots en appuyant sur la touche Ctrl de votre clavier; et d'appuyer sur le boutton "concordance".

++ Résultat de la concordance :
4>> Ici apparaissent les contextes gauche, le pôle ( c'est a dire les occurrences recherchées) et le contexte droit. Nous avons paramétré à 5 le nombre de mots en contexte gauche et droit.

++ Treetagger (cliquez sur l'image pour voir le script qui s'y rattache )
5
Ici il annote le texte et le catégorise en patrons syntaxiques.

++ L'extraction de patrons :
(cliquez sur l'image pour voir le script qui s'y rattache )
6
Ici le programme m'a extrait les patrons de la forme Nom/adj.

++ Le rapport fait sur le fichier analysé :  
(cliquez sur l'image pour voir le script qui s'y rattache )
7

++ Le manuel :
(cliquez sur l'image pour voir le script qui s'y rattache )
8

Dans le manuel, vous trouverez toutes les grandes applications de l'extracteur et vous verrez notamment comment les faire marcher.
haut de page
<-page précédente-page suivante->