Qu'est-ce que Python?
C'est un langage. Il est utilisé pour écrire des scripts et automatiser des tâches simples mais fastidieuses, par exemple un script qui récupérerait la météo sur Internet.

Nettoyer une page Web
Avec Python, on a décidé de nettoyer une page web. Ce n'était pas une chose aisée.
Voici le code: téléchargeable ici


Le résultat donné: Télécharger
Le résultat n'étant pas totalement propre, j'ai procédé à la main pour enlever les balises restantes. Ce qui donne: ça.

Les grandes lignes de ce programme sont:
  • Importer des librairies dans Python.
  • Extraire une page web et son code source.
  • Nettoyer le code source de toutes les balises.
  • Réécrire le code nettoyé dans un fichier externe.
  • Compter le nombre de caractères, mots, phrases...
Pour ma part, je n'ai fait que compter le nombre de caractères.
J'ai juste rajouté quelques lignes dans le code précédent:


Fichier résultat: Infostat


Accueil                                                                               Partie suivante                                                           Haut de page