Python

Les 5 grandes étapes sont :

  • Récupérer le code source d'une page html
  • Nettoyer le code source à l'aide d'expressions régulières
  • Générer un fichier de résultat contenant le code source nettoyé
  • Opérer des décomptes sur le texte (caractères, mots, phrases)
  • Générer un fichier de résultat contenant les résultats des décomptes

Etape 1:

Etape 2:

Etape 3:

Etape 4:

Etape 5:

Télécharger le script en entier

Voir la page web nettoyée

Voir les résultats du script