Python

Sommaire :
- 2.0 Travail sur les mots : [code] [écriture du résultat] [résultat]
- 2.1 extraction du titre de page :
[code] [écriture du résultat] [résultat]
- 2.2 extraction des liens :
[code] [écriture du résultat] [résultat]
- 2.3 Classification syntaxique :
[code] [écriture du résultat] [résultat]
Voir le résultat obtenu pour tout les exercices.

On commence par charger les éléments dont nous allons nous servir, on prépare le travail sur la page web.
On supprime les balises html et on découpe les mots dans la page en les délimitant par des caractères non alphanumériques pour les placer dans liste.


Dans le 2.0 de cette partie il fallait compter les mots de la page web, compter les mots différents et leur fréquence d'apparition. Pour cela on créer une liste qui regroupe tout les éléments et à l'aide d'une boucle on va compter les occurrences différentes de mots et on va aussi compter le nombre de fois ou ils apparaissent.

Voir comment on écrit ce résultat Voir le résultat



Dans le 2.1 il fallait récupérer le titre de la page web

Voir comment on écrit ce résultat Voir le résultat



Dans le 2.2 il fallait récuperer les liens se trouvant sur la page, pour cela nous utilisons la fonction regexp qui cherche les expressions régulières en l'occurrence celles qui introduisent un lien html, et nous allons ainsi récuperer le lien, mais aussi le nom du lien (le lien avec et sans son expression régulière).

Voir comment on écrit ce résultat Voir le résultat



Dans le 2.3 on voulait faire trier les mots par leurs catégories syntaxiques. Nous n'avons pas d'autre choix ici que de remplir des listes des catégories syntaxiques afin que la machine puisse comparer les occurences qu'elle relève dans la page web avec celles dans ses listes.

Voir comment on écrit ce résultat Voir le résultat



Les travaux sur la page web et ses éléments effectués il ne reste plus qu'à écrire les résultats, nous avons choisi de le faire sur une page web.


Ecriture du 2.1 Titre de la page

Voir le code en relation



Ecriture du 2.0 Travail sur les mots de la page

Voir le code en relation



Ecriture du 2.2 Travail sur les liens de la page

Voir le code en relation



Ecriture du 2.3 Travail sur les classes syntaxiques

Voir le code en relation



On fini le script de la page résultat, et on se met un indicateur sur python pour nous avertir lorsque toutes les tâches seront effectuées.

Voir le résultat complet



Voilà comment j'ai appris à utiliser Python !

Haut de page