Dans cette partie nous avons travaillé sur le logiciel python. Nous avons effectué les 5 étapes: Récupérer le code source d'une page html, Nettoyer le code source à l'aide d'expressions régulières, Générer un fichier de résultat contenant le code source nettoyé, Opérer des décomptes sur le texte (caractères, mots, phrases), Générer un fichier de résultat contenant les résultats des décomptes(explicité dans le script à l'aide de #)

Ci dessous: les résultats de notre script.

code de la page web nettoyée
fichier de résultat contenant les résultats des décomptes
capture d'écran du dossier python

L'encodage utilisé est : utf-8