Exercice sur le père Duchesne

Le but de cette exercice est d'opérer des recherches de mots dans le texte du Père Duchesne, à l'aide d'expressions régulières.

Les documents utilisés:
texte du père Duchesne (isolatin) : ICI
texte du père Duchesne (utf8) : ICI

Question 1 : les mots commençant par citoy-

commande egrep :


Résultat de la commande

Cette commande permet de chercher les mots dont la racine commune est "citoy" comme dans "citoyen" ou "citoyenneté". Ainsi, l'expression régulière comprendra l'opérateur /b qui indique les débuts de chaines de caractères.

Question 2 : les mots commençant par aristo-

commande egrep :



Résultat de commande

Cette commande repère les lignes contenant les mots commençant par "aristo". Comme pour la commande précédente, on utilise l'opérateur de regex \b qui indique les frontières des mots.

exemple trouvé: aristocratie ou aristocrat

Question 3 : les mots commençant par bougre-

commande egrep :



Résultat de la commande

Cette commande cherche les lignes qui contiennent des mots commençant par "bougre" toujours grâce à l'opérateur \b.

exemples trouvés: bougre ou bougres

Question 4 : les mots qui parlent de sans-culottes

commande egrep:


résultat de la commande

Pour trouver les lignes parlant de "sans-culottes", il suffit de trouver des instances du
mot (ou partie de mot) "culotte" pour trouver tous les mots dérivés de "sans-culotte" comme "sans-culotterie"

Question 5 : les mots contenant une majuscule

commande egrep:


résultat de la commande

Le texte analysé du fichier duchn.txt est écrit sans majuscules. Les mots devant avoir une lettre
majuscule sont précédés par *. Parce que ce symbole est en fait un opérateur en regexp, il faut annuler sa fonction
avec \ pour pouvoir le traiter comme une chaîne de caractères et non pas comme un opérateur. D'où l'expression régulière "\*"

Question 6 : les mots se terminant par -er

commande egrep:


résultat de la commande

Cette commande cherche les lignes qui contiennent des mots qui se terminent avec 'er'. L'expression régulière contient également l'opérateur /b mais cette fois-ci en fin de mot.

Question 7 : les mots qui parlent de danger

commande egrep:


résultat de la commande

Pour trouver les mots qui parlent de 'danger' il suffit de chercher les mots contenant 'danger.' Car si l'on utilise l'expression régulière "dang", la commande peut trouver des mots comme "vendange".

Question 8 : les mots qui parlent de patrie

commande egrep:


résultat de la commande

Avec cette commande, on recherche tous les mots qui dérivent de 'patrie'.
La première expression, \bpatri[eoa], permet certes de résoudre cette question. Cependant, parmi les résultats de cette commande, on peut trouver des mots comme patriarche, qui n'ont rien à voir avec "patrie".
De ce fait, pour pallier ce problème, on choisira la deuxième expression, \bpatri[^a], qui recherche tous les mots commençant par 'patri' sauf ceux dont la prochaine lettre est 'a' .
Ainsi, nous pouvons obtenir des mots du même champ lexical que "patrie"

Question 9 : les mots qui parlent de liberté

commande egrep:


résultat de la commande

Cette commande permet de trouver des mots parlant de 'liberté', toujours grâce à l'opérateur \b

Question 10 : les mots qui parlent de temps

commande egrep:

résultat de la commande

On cherche avec cette commande les mots qui contiennent le texte 'temps'.
Dans ce fichier, le mot 'temps' est utilisé comme "état de l'atmosphère" ou bien comme "durée".

Question 11 : les mots qui parlent de république

commande egrep:


résultat de la commande

Cette commande permet de trouver tous les mots parlant de 'république'. Etant donné la présence du e accentué, la commande est effectuée dans le fichier Duchn-utf8.txt

Question 12 : les mots qui parlent de trahison

commande egrep:


résultat de la commande

Pour trouver les mots qui parlent de "trahison", il suffit de chercher les mots commençant par 'trahi' pour trouver
tous les mots appropriés comme "trahir"

Question 13 : les constructions négatives dans le texte

commande egrep:


résultat de la commande

Pour trouver les constructions négatives dans le texte, il suffit de chercher le mot 'ne' ou bien 'n''.

Retour vers la Partie 2