<

Partie 1: Pyton

Python est un langage de programmation qui peut s'utiliser dans de nombreux contextes et s'adapter à tout type d'utilisation grâce à des bibliothèques spécialisées à chaque traitement. Le script suivant a pour but de récupérer le code HTML d'une page web, d'en extraire les informations que l'on veut, de convertir tout cela en texte et de le traiter.

Nous utiliserons pour notre étude La page de résumé du malade imaginaire.

Dans un premier temps je voudrais vous présenter un exercice sur Pyton fait en TD.

Nous allons vous présenter les 5 étapes de notre programme PYTON.

Etape 1: Nous avons récupéré le code source de la page html.

Etape 2: Nous avons nettoyé le code source à l'aide des expressions régulières.

Etape 3: Nous avons créé un fichier de résultat contenant le code source nettoyé.

Etape 4: Nous avons opéré des décomptes sur le texte et généré un fichier de résultat.

Etape 5:Nous avons généré un fichier de résultat.

Fichier de la page nettoyé (format txt).

Script écrit en Python (format py).
                                                                                                                               Retour Haut de page