Travail sur Python

Pour ce travail nous avons tout d'abord récupéré le code source d'une page html. Nous avons choisi la première page d'un blog consacré à la préparation aux concours d'orthophonie. Nous l'avons choisi car ce site est pratique et sympathique.

Pour accéder à ce site, cliquez ici.

Nous avons ensuite travaillé sur Python. Le script que nous avons rédigé permet de récupéré le code source de la page html choisie, de la nettoyer et ainsi de récupérer seulement le texte.

Pour accéder au texte, cliquez ici

La page ainsi nettoyée, nous avons pu compter le nombre de caractères et de mots que contenait le texte. Les mots ont alors été triés par odre alphabétique et leur fréquence a été calculée elle aussi.

Pour accéder aux statistiques, cliquez ici

Pour accéder au script Python cliquez ici