Partie 1 : PROGRAMMER AVEC PYTHON

Python est très utile pour le traitement des textes car il permet notamment de:

  • dialoguer avec une page web dans sa version brute, c'est-à-dire avec les codes html
  • nettoyer le contenu de cette page pour la sauvegarder dans nos documents
  • ajouter via le fichier crée du contenu à la page comme par exemple le nombre de caractères, de mots et de phrases contenu dans le texte de la page effectuer des calculs en fonction de ces données

Soit un texte reproduisant le (méta-)discours d'un traducteur et disponible sur internet, très précicémment içi

Le script que j'ai écrit en me basant sur ce texte se présente ainsi.

Une fois le script exécuté. On retrouve donc dans l'ordre :

  • le texte dépouillé des balises html
  • des indications sur le nombre de caractères, le nombre de mots et le nombre de mots différents
  • la liste exhaustive des mots du texte et le nombre de fois où ils apparaissent
  • le nombre de phrases
  • et le nombre moyen de caractères par mot
  • Ce qui donne ça.