II. PYTHON PYTHON!!


Notre page html est la page de l'ILPGA : http://ilpga.fr

Le logiciel Python a pour but de nettoyer une page web donnée et d'établir un décompte des caractères.A partir de cela, il nous faudra créer des fichiers de sorties dans lesquelles il y aura les résultats obtenus. Le tout, bien sûr, avec LES EXPRESSIONS REGULIERES...


5 étapes importantes pour notre travail :


1) Récupérez le code source de la page HTML:


2) Avec l'aide des expressions régulières nous allons nettoyer le code source de la page HTML:


4) Faire des décomptes à partir du texte même:


A SAVOIR


Ici, nous créons un fichier " infostat" dans lequel on pourra voir les résultats. "len()" permet de calculer la longueur d'une liste "strc()" permet d'établir une chaine de caractères d'un nombre