I) Partie Python                                                                            Page d'accueil                                                          


-> Qu-est ce que Python ? Cliquez ici pour encore plus d'informations.
Python est un langage permettant de faire de la programmation. Il est important de signaler que nous avons utilisé le logiciel Python 2.7.5.


  

°Nos premiers pas avec Python - Quelques commandes simples pour débuter

- Print : Nous permet d'afficher une chaîne de caractères. Pour cela, on se sert des guillemets (simples ou doubles).




- Raw Input : Pour avoir des informations supplémentaires.

- # : Nous sert à mettre les commentaires que l'on souhaite sur le travail que l'on fait.

- + ou * : Calcul et combinaison.
- Fichierlec = Ouvrir, mettre en connection.
- Open
: Ouvrir le fichier.
- Read = Lire le fichier.
- Close = Referme le fichier.
- == : Valeur d'égalité, signifie la même chose.



°Les variables en Python

Pour débuter sur Python, nous avons utilisé des variables. En effet, nous avons fait un stockage d'informations dans des variables telles que monnom = "Marie Dupont" et tonnom = "Pierre Martin". L'intérêt de m'exercice était d'utiliser ces variables pour avoir la sortie suivante : Puis, par la suite, nous avons fait un autre stockage où l'on devait obtenir grâce aux variables : Mon nom est Marie Dupont et tu t'appelles Pierre Martin.



Récapitulation

-
Stockage d'informations dans des variables

>>> monnom = "Marie Dupont"
>>> tonnom = "Pierre Martin"

- Sortir les informations

>>> print tonnom
>>> print tonnom,monnom
>>> print tonnom+monnom






°Notre premier script en Python


 

Voici l'impression d'écran de notre travail de récupération du code HTML sur la page d'orange



Voici les captures d'écran de la page de l'ILPGA (Les commentaires sont écrits à l'aide du dièse)







    Nous avons appris à partir du site internet d'orange et celui de l'Ilpga à :

- Récupérer et décoder le code HTML de la page d'orange puis celle de l'Ipga.
- Nettoyer la page et les balises grâce aux expressions régulières (egrep : nous verrons la signification dans la partie XML)
.
- Construire un fichier avec la page nettoyée
.
- Décompter le texte
.
- Faire un fichier avec les résultats.


Encodage de la page de l'ILPGA :

#-*-coding:utf-*-importurllib,re
url = urllib.urlopen("http:ilpga.fr")
codehtml = urlread()
codehtml = codehtml.decode