Traitement d'un page web sous Python

L'exercice consistait à extraire le code d'une page web à l'aide d'un script python et de nettoyer ce code afin d'en récupérer uniquement le texte, débarrassé de ses balises, erreurs d'encodage...
L'énoncé de l'exercie ne précisait pas si le script devait marcher sur n'importe quelle page du web, j'ai donc pris la liberté de l'adapter précisément à la page que je traitais, ce qui était évidemment plus simple. Les bons informaticiens sont tous flemmards de toute façon.
Enfin il nous fallait établir des statistiques sur le texte obtenu.

  • la page que j'ai traité
  • le script format py
  • le script format txt
  • résultat du nettoyage
  • statistiques obtenues