Projet Barrage

Etape 4: Le contexte de "barrage"

Comme nous l'avons promis dans l'étape 3, nous allons vous expliquer ce qu'est egrep et à quoi il va nous servir dans notre projet.

Egrep permet, à partir d'un fichier, d'extraire les lignes qui contiennent un patron ou motif donné. Cette commande accepte les expressions régulières. Nous vous présenterons ici quelques opérateurs d'expressions régulières:
- le point '.' signifie n'importe quel caractère
- l'étoile '*' signifie la répétition du caractère de 0 à l'infini
- le point d'interrogation '?' spécifie que le caractère qui précède est optionnel
- le "plus" '+' indique que le caractère qui précède est repété au moins 1 fois jusqu'à l'infini
- les crochets [ ] permettent d'indiquer un ensemble
Exemple: [a-z] désigne les minuscules, [A-Z] les majuscules, [a-z A-Z] les lettres.
- le trait vertical '|' signifie "ou"
Exemple: "fai(re|t)" signifie qu'on cherche soit le mot "faire", soit "fait".
- l'antislash '\' permet de déspécialiser un caractère
- '^' indique le début de ligne et '$' la fin de ligne. Attention: [^...] ici, il s'agit de la négation de ce qui suit.
- '\b' permet de représenter le début et le fin de mot
- '\B' représente le contenu d'un mot

Donc, dans le cadre de notre projet, nous avons utilisé Egrep afin d'extraire les lignes contenant le mot "barrage" des fichiers que nous avons récupérés avec Lynx (ici). Voici la commande utilisée:

egrep -i -A 2 -B 2 "barrage."

L'option -i permet de ne pas tenir compte de la casse, -A 2 permet d'avoir les 2 lignes après, -B 2 les 2 lignes avant et le fait d'avoir mis un '.' à la fin de barrage permet de chercher "barrage" aussi bien au singulier qu'au pluriel.
Les fichiers .txt obtenus sont stockés dans le dossier Contextes.

Afin d'accéder plus facilement à tous ces fichiers obtenus durant les différentes étapes, nous les avons classés dans un tableau que nous décrirons en détail dans l'Etape 5.