Exercice 1 : Travail sur le Père Duchesne

Cet exercice consiste à utiliser les expressions régulières egrep dans une fenêtre de commande UNIX sur CYGWIN afin de réaliser des recherches textuelles.
Vous trouverez le corpus ici.
Ainsi, pour utiliser les commandes egrep, il faut d'abord indiquer "egrep" pour signifier le types de commande puis espace puis entre guillemet le motif recherché, espace, le document dans lequel on veut effectuer la recherche, espace, et eventuellement le document à créer dans lequel on veut inscrire le résultat de la recherche.

Question n°1: Commande permettant de filtrer les lignes contenant des mots commençant par « citoy ».

Ici, la commande "\b" utilisée avant la chaîne de caractères recherchée cible la recherche sur les débuts de mot : on recherche donc tous les débuts de chaîne de caractères "citoy" afin d'obtenir toutes les lignes contenant les mots ayant ce radical.

Résultat obtenu

Question n°2 : Commande permettant de filtrer les lignes contenant des mots commençant par « aristo ».

Ici, on fait la même chose pour obtenir toutes les lignes contenant des mots commençant par "aristo" afin de cibler les mots ayant ce radical.

Résultat obtenu

Question n°3 : Commande permettant de filtrer les lignes contenant des mots commençant par « bougre ».

On fait à nouveau la même chose, de façon à obtenir les lignes contenant "bougre" mais aussi "bougres" ou "bougrement".

Résultat obtenu

Question n°4 : Commande permettant de filtrer les lignes contenant des mots qui parlent des « Sans-culottes ».

Ici, on indique seulement le radical, de façon à obtenir les lignes contenant le mot "culotte", ainsi on aura un relevé des mots qui parlent des "sans-culotte" : "sans-culottes", "sans-culotte", "sans-culotterie"...

Résultat obtenu

Question n°5 : Commande permettant de filtrer les lignes contenant des mots contenant une majuscule.

Ici, il faut d'abord faire attention à la façon dont sont identifiées les majuscules dans le texte de base car c'est ce qui constituera le motif à rechercher.

Résultat obtenu

Question n°6 : Commande permettant de filtrer les lignes contenant des mots qui se terminent par « er ».

Ici, on utilise "\b" à la fin de la chaîne de caractère qu'on recherche pour indiquer la frontière de caractères de fin, donc de fin de mot.

Résultat obtenu

Question n°7 : Commande permettant de filtrer les lignes contenant des mots qui parlent de «danger ».

Ici, on recherche simplement le radical afin d'obtenir les lignes qui le contiennent, on aura donc : "danger", "dangers", "dangerosité"...

Résultat obtenu

Question n°8 : Commande permettant de filtrer les lignes contenant des mots qui parlent de «patrie ».

Ici, à nouveau nous utilisons la frontière de début de mot et une recherche par radical.

Résultat obtenu

Question n°9 : Commande permettant de filtrer les lignes contenant des mots qui parlent de « liberté ».

Ici, on réutilise les mêmes critères de recherche.

Résultat obtenu

Question n°10 : Commande permettant de filtrer les lignes contenant des mots qui parlent de « temps ».

Ici, on indique qu'on recherche la chaîne de caractères "temp" suivi de "o" ou "s", de façon à obtenir les lignes pouvant contenir soit le radical "temps" soit le radical "tempo", on pourra ainsi trouver : "temporel", "temps", "temporalité"...

Résultat obtenu

Question n°11 : Commande permettant de filtrer les lignes contenant des mots qui parlent de « république ».

Ici, on utilise le "." ,qui signifie n'importe quel caractère, à la place de "é" ou "e".

Résultat obtenu

Question n°12 : Commande permettant de filtrer les lignes contenant des mots qui parlent de « trahison ».

On effectue ici une recherche par radical.

Résultat obtenu

Question n°13 : Commande permettant de filtrer les lignes contenant des séquences de mots comportant une forme négative : ne...pas, n’...pas, .... ».

Ici on indique que l'on recherche un mot commançant par "n" et terminé par soit "e" soit "i" soit "apostrophe" de façon à obtenir toutes les lignes contenant des adverbes de négation.

Résultat obtenu

Ces expressions régulières ont aussi été testées sur le logiciel Antconc, téléchargeable ici :

Retour    Accueil