Partie 1 : Python

1. Récupération de la page internet

image 1

2. Nettoyage de la page internet


image 2


3. Création d'un fichier


Image 3


4. Faire des statistiques avec le texte

Image 4

la troisième ligne(infostat.write) permet de calculer le nombre de mots du texte et le nombre de mots différents dans le fichier cible.

5. Fichier de résultat contenant les résultats des décomptes


image 5

Vous pouvez trouver la page web sur laquelle nous avons travaillé et le fichier contenant les résultats des décomptes.

Les 5 grandes étapes de notre programme sont :

1. Récupération de la page internet
2. Nettoyage de la page internet
3. Création d'un fichier
4. Opérer des décomptes sur le texte
5. Création d'un fichier de résultats contenant les résultats des décomptes

Pour effectuer ce travail nous avons utilisé la page d'accueil de l'ILPGA. Les difficultés rencontrées du traitement de la page web ce sont les fonctions et les expressions régulières qu'il faut toujours bien écrire car elles sont sensibles par exemple si on a oublié un caractère ou si on a ajouté un espace en trop ca peut fausser toute l'expression.