Retour à l'accueil

Programmation avec le logiciel Python

  • Choix et récupération de la page HTML

Nous apprenons toutes les deux le hongrois, ainsi tout naturellement, nous avons choisi une page retraçant brièvement l'histoire de la Hongrie qui aujourd'hui est au coeur des événements politiques.

Page HTML choisie
Script Python



Désormais, on va pouvoir travailler sur cette page et la nettoyer.
  • Nettoyage de la page HTML et suppression des balises


  • Générer un fichier qui contient la page nettoyée de toutes ses balises
Pour voir la page nettoyée

  • Décomptes des mots et caractères du texte

  • Générer un fichier qui contient l'ensemble des résultats en prenant soin de fermer le fichier


Résultats des opérations effectuées dans le texte

La page contient 198 phrases
Elle compte 5463 mots, dont 1778 différents
Le nombre moyen de caractères par mot est de 6