Exercice n°1


Dans cet exercice, nous devions faire des recherches textuelles en utilisant des expressions régulières egrep. Pour cela nous avons utilisé le logiciel CYGWIN.
Une fois dans la fenêtre de commande UNIX, nous avons utilisé les commandes egrep:
Ainsi on doit indiqué la commande egrep, puis on doit mettre l'expression régulière entre guillemets, suivi du document où on veux faire la recherche et si on veut on peut rajouter le nom du document où on veut que le résultat s'inscrive.

Ici se trouve le corpus que nous avons utilisé.



Question n°1: Commande permettant de filtrer les lignes contenant des mots commençant par « citoy ».

Ici nous utilisons l'expression régulière \b avant la chaine de caractères recherchée, cela indique que cette chaine de caractères se trouve en début de mot. On recherche donc tout les mots commençant par "citoy".

Résultat obtenu


Question n°2: Commande permettant de filtrer les lignes contenant des mots commençant par « aristo ».

Ici aussi nous utilisons l'expression régulière \b pour extraire tous les mots commençant par "aristo".

Résultat obtenu


Question n°3: Commande permettant de filtrer les lignes contenant des mots commençant par « bougre ».

Encore une fois on utilise \b pour obtenir tous les mots commençant par "bougre".

Résultat obtenu


Question n°4: Commande permettant de filtrer les lignes qui parlent des « Sans-culottes ».

Ici on indique que le radical "culotte", ainsi on aura tous les mots comme "Sans-culotte", "sans-culottes", "sans-culotterie"...

Résultat obtenu


Question n°5: Commande permettant de filtrer les lignes contenant une majuscule.

Dans le corpus "duchn.txt", les majuscules sont des minuscules marquées par une étoile "*". C'est pourquoi on recherche ce symbole et non une majuscule. Le symbole "\" devant "*" indique qu'on inhibe l'expression régulière pour n'avoir que le caractère.

Résultat obtenu


Question n°6: Commande permettant de filtrer les lignes qui se terminent par « er » .

Ici on utilise l'expression régulière \b après la chaîne de caractères, ce qui indique que cette chaîne de caractères doit se trouver en fin de mot. On recherche donc tous les mots se terminant par "er".

Résultat obtenu


Question n°7: Commande permettant de filtrer les lignes qui parlent de « danger ».

Ici on recherche tous les mots contenant le radical "danger", on obtiendra donc des mots tels que "dangereux", "danger", "dangerosité"...

Résultat obtenu


Question n°8: Commande permettant de filtrer les lignes qui parlent de « patrie ».

Ici aussi on recherche tous les mots contenant le radical "patri".

Résultat obtenu


Question n°9: Commande permettant de filtrer les lignes qui parlent de « liberté ».

Pour cette commande, nous cherchons les mots qui contiennent le radical "lib" suivi de "re" ou de "er", ainsi on  obtiendra des mots tels que "liberté" ou "libre".

Résultat obtenu


Question n°10: Commande permettant de filtrer les lignes qui parlent de « temps ».

Ici, on cherche les mots contenant le radical "temp" suivi du caractère "s" ou "o". Ainsi on obtient des mots comme "temporel" ou "temps".

Résultat obtenu


On a ici deux sens de "temps":
- le temps physique
- le temps météorologique


Question n°11: Commande permettant de filtrer les lignes qui parlent de « république ».

Dans cette commande nous utilisons l'expression régulière "." qui indique qu'il peut y avoir n'importe quel caractère. On recherche donc des mots contenant le radical "républi" comme le radical "republi".

Résultat obtenu


Question n°12: Commande permettant de filtrer les lignes qui parlent de « trahison ».

Ici on cherche les mots contenant le radical "trahi".

Résultat obtenu


Question n°13: Commande permettant de filtrer les lignes contenant des séquences de mots comportant une forme négative : ne...pas, n’...pas, etc.

Ici on utilise les expressions régulières \b, pour marquer le début et la fin de mot, on cherche donc un mot commençant par "n" et suivi d'un "i", d'un "e" ou d'une apostrophe. L'étoile indique qu'il peut y avoir plusieurs autres caractères après. Ainsi on obtient les lignes où se trouvent des adverbes de négations comme "ne... pas", "n'...pas", "ne...point", "ni..." etc...

Résultat obtenu