Python

  • Nous avons récupéré le code source d'une page html,
  • Nettoyé le code source à l'aide d'expressions régulières
  • Généré un fichier de résultat contenant le code source nettoyé
  • Opéré des décomptes sur le texte (caractères, mots, phrases)
  • Et généré un fichier de résultat contenant les résultats des décomptes
  • Voici notre script :Resume.py

    Notre fichier pageweb.txt

    Notre fichier infostat.txt

    Et le fichier contenant les liens extraits de la page web