Introduction aux expressions régulières


Dans cette partie nous avons utilisé un corpus de Zola télécharegeable ICI.

Ce corpus étant constitué de plusieurs fichier txt, il était util pour pouvoir sonder tous les fichiers à la fois de concaténer ces fichiers en un seul nommé ZOLA.txt et téléchargeable ici.

  1. Chercher toutes les lignes commençant par «a» ou «A».
  2. Chercher toutes les lignes finissant par «rs».
  3. Chercher toutes les lignes contenant au moins un chiffre.
  4. Chercher toutes les lignes commençant par une majuscule.
  5. Chercher toutes les lignes commençant par «B», «E» ou «Q».
  6. Chercher toutes les lignes finissant par un point d'exclamation.
  7. Chercher toutes les lignes ne finissant pas par un signe de ponctuation (point, virgule, point-virgule, deux-points, point d'interrogation, point d'exclamation).
  8. Chercher tous les mots contenant un «r» précédé de n'importe quelle lettre majuscule ou minuscule.
  9. Chercher tous les mots dont la seconde lettre est un «r».

Comme on peut le voir sur les premières captures d'écran, sur cet exercices nous avons du faire face à un soucis d'encodage, en effet les accents n'étaient pas pris en compte ce sui faussait les résultats. Nous avons



 

Haut de page