Python

Nous allons travailler sur la page wikipédia d'Yves Rocher avec le logiciel Python et des expressions régulières. Notre but est de nettoyer la page et de faire un décompte des différents caractères ainsi que des différents mots.

Étape 1: tout d'abord, nous récupérons le code source de la page html choisie.

Étape 2 et 3: puis nous créons un fichier de sortie pour la future page html nettoyée (suppression de balises, d'espaces, etc...)

Voici le résultat de la page nettoyée: Cliquer ici !

Étape 4 : ensuite, nous comptons les mots ainsi que les caractères.

Voici le fichier de sortie avec les résultats:

Étape 5 : pour finir, nous créons le dictionnaire contenant la fréquence des mots de la page Yves Rocher.

Voici le résultat

Vous trouverez ici le script entier.