Le Langage Python

Avec le langage Python, nous devions extraire une page web dans un script et la nettoyer de toutes les balises afin de convertir les informations qui nous intéressent en texte.

Pour ce travail, nous opérons par étapes :

          - La récupération de la page web

          - Le nettoyage de la page web avec des expressions régulières

          - Création du code source nettoyé des balises

          - Effectuer les statistiques

          - Création du fichier contenant les résultats

 1) Récupération de la page web

Voici le site choisi : cliquer ici

Ici nous procédons à la récupération de la page web.


2) Nettoyage de la page web avec des expressions régulières



3) Création du code source nettoyé des balises



4) Effectuer les statistiques et 5) effectuer une liste contenant les résultats du fichier