Script Python

Nous avons effectué le travail attendu en suivant les cinq étapes requises sur une page web choisie: http://ugc.fr/home.html. Cette page est encodée en html et comporte du javascript.

  • Etape 1
  • La première étape consiste en la récupération du code source de la page html en question.


  • Etape 2
  • Il a, ensuite, fallu nettoyer le code source à l'aide d'expressions régulières.


  • Etape 3
  • Générer un fichier de résultat contenant le code source nettoyé.


  • Etape 4
  • Opérer des décomptes sur le texte (caractères, mots, phrases).


  • Etape 5
  • Enfin, générer un fichier contenant les résultats des décomptes



    Vous pouvez désormais consulter le fichier texte de la page nettoyée: Cliquez ici
    Vous pouvez également consulter le fichier des résultats correspondant aux étapes 4/5. Cliquez ici
    (Pour le Script Python dans son intégral, cliquez ici)