Première Partie

image

Python est un langage de programmation que j'ai découvert pendant ce semestre. Vous pouvez trouver des informations sur Python ici.

Au cours de ce semestre, j'ai réalisé, dans les travaux dirigés, divers programmes dont vous trouverez un exemple ici et un grand script qui sera présenté dans cette partie.
Pour le grand programme, il fallait:

  • Choisir une page web et récupérer le code source de cette page web
  • Nettoyer cette page web en utilisant des expressions régulières. Par exemple, il fallait enlever les balises HTML
  • Générer un fichier de résultat
  • Opérer des décomptes sur sur le texte. Par exemple, compter le nombre de mots et le nombre de lignes dans le texte.
  • Générer un fichier de résultat contenant ces résultats

Ces étapes peuvent être représentées de manière schématique:
schéma
Pour voir mon programme avec l'explication des fonctions Python, et les fichiers de résultat, cliquez ici