Qu'est-ce que Python ?



PYTHON est un langage de programmation qui facilite le développement d'applications, de prototypes et de scripts.


Maintenant je vais vous présenter le travail réalisé en Python au cours du semestre en 5 grandes étapes.

    1. Tout d'abord, j'ai créé un script en Pyton afin de récupérer le code source d'une page html.


    2. Ensuite, je l'ai nettoyé de toutes les balises en utilisant des expressions régulières.

    3. J'ai créé également un fichier de résultat avec le code source nettoyé.

    4. Puis, j'ai fait des décomptes sur le texte. J'ai cherché le nombre de caractères, de mots et de phrases dans le texte.

    5. Enfin, j'ai créé un fichier de résultat contenant les résultats des décomptes.

    Pour télécharger:
    • le script en Python, cliquez ici
    • le fichier avec le code source nettoyé, cliquez ici
    • le fichier contenant les résultats des décomptes, cliquez ici

    Quelques informations supplémentaires:

    • Expliquez votre choix de page web nettoyé
    • J'ai choisi cette page web par hasard. Puisque je suis en Sciences du langage, je voulais trouver un texte lié a la linguistique.
    • Indiquez les caractéristiques de la page choisie (encoding, charset, javascript).
    • Beaucoup de notes et de liens vers les informations comprises sur la page meme.
    • Donnez des exemples de difficultés de traitement de votre page web
    • Au début, j'ai eu quelques problèmes pour afficher correctement les accents dans le fichier que j'ai créé.