Travail attendu pour le devoir final

Nous avions pour consigne de créer un script qui récupèrerait le code source d'une page html pour en faire une analyse.



Tout d'abord, voici un exemple d'exercice effectué durant nos premiers TD :




Les différentes étapes de notre programme:

Lien vers la page HTML choisie

Tout d'abord nous avons récupéré le code source d'une page html (1):



Puis nous avons nettoyé ce code source avec des expressions régulières (2) :



Ensuite nous avons généré un fichier de résultat contenant le code source nettoyé (3) :



Après cela nous avons opéré des décomptes sur le texte (4) puis nous avons créé un nouveau fichier contenant ces décomptes (5) :

Lien vers la page nettoyée
Lien vers le résultat des décomptes