Exercice 1 :

Document utilisé : Discours du Père Duchesne


Question n°1

Commande tapée avec egrep :


Résultat de la commande

Justification :

Cette commande trouve les lignes qui contiennent les mots commençant par "citoy". Par exemple,
"citoyen" ou "citoyenneté"


Question n°2


Commande tapée avec egrep :


Résultat de la commande

Justification :

Cette commande trouve les lignes qui contiennent les mots commençant par "aristo," comme, par exemple,
"aristocratie" ou "aristocrat", en utilisant l'opérateur de regex \b qui indique les frontières des mots.


Question n°3

Commande tapée avec egrep :


Résultat de la commande

Justification :

Cette commande cherche les lignes qui contiennent des mots commençant par "bougre" grâce à l'opérateur \b.


Question n°4

Commande tapée avec egrep :


Résultat de la commande

Justification :

On essaie de trouver les lignes parlant de "sans-culottes" et donc il suffit de trouver des instances du
mot (ou partie de mot) "culotte" pour trouver tous les mots dérivés de "sans-culotte" comme "sans-culotterie."


Question n°5

Commande tapée avec egrep :


Résultat de la commande

Justification :

Le texte dans le fichier duchn.txt est écrit sans majuscules, mais les mots qui doivent avoir une lettre
majuscule sont marqués par *. Parce que ce symbole est en fait un opérateur en regexp, il faut annuler sa fonction
avec '\' pour pouvoir le traiter comme une chaîne de caractères et non pas comme un opérateur.


Question n°6

Commande tapée avec egrep :


Résultat de la commande

Justification :

Cette commande cherche les lignes qui contiennent des mots qui se terminent avec 'er'


Question n°7

Commande tapée avec egrep :


Résultat de la commande

Justification :

Pour trouver les mots qui parlent de 'danger' il suffit de chercher les mots contenant 'danger.'


Question n°8

Commande tapée avec egrep :


Résultat de la commande

Justification de la commande:

Il y a beaucoup de mots qui se dérivent de 'patrie,' mais il ne suffit pas de chercher les mots commençant
par 'patri' parce qu'on trouvera des mots comme 'patriarche' qui n'ont rien à voir avec 'la patrie'. Donc il faut
créer une expression régulière qui cherche tous les mots commençant par 'patri' SAUF ceux dont la prochaine
lettre est 'a' et on n'aura comme résultat que les mots dans le même champ léxicale que 'patrie.'


Question n°9

Commande tapée avec egrep :



Résultat de la commande

Justification :

Cette commande permet de trouver des mots parlant de 'liberté'.


Question n°10

Commande tapée avec egrep :


Résultat de la commande

Justification :

On cherche avec cette commande les mots qui contiennent le texte 'temps'. Dans ce fichier, le mot 'temps' est
utilisé comme 'état de l'atmosphère' ou bien comme 'durée'.


Question n°11

Commande tapée avec egrep :


Résultat de la commande

Justification :

Cette commande permet de trouver tous les mots parlant de 'république'.


Question n°12

Commande tapée avec egrep :



Résultat de la commande

Justification :

Pour trouver les mots qui parlent de 'trahison', il suffit de chercher les mots commençant par 'trahi' pour trouver
tous les mots appropriés comme 'trahir.'


Question n°13

Commande tapée avec egrep :


Résultat de la commande

Justification :

Pour trouver les constructions négatives dans le texte, il suffit de chercher le mot 'ne' ou bien 'n''.


Exercice 2 :

Documents utilisés : dico.txt
                            dico-etiquette.txt


Question n°1

Commande tapée avec egrep :

Résultat de la commande

Justification :

Avec la commande wc on peut compter tous les mots dans une fichier. Dans ce cas, le résultat est 136252 mots.


Question n°2

Commande tapée avec egrep :



Résultat de la commande

Justification :

Avec cette commande, on trouve des mots avec -able à la fin.


Question n°3

Commande tapée avec egrep :




Justification : 

La première commande permet de compter le nombre de mots qui se terminent par -able. La deuxième commande relève ces mots de la fichier dico-etiquette.txt et nous permet de voir les catégories grammaticales de ces mots.


Question n°4

Commande tapée avec egrep :


Résultat de la commande

Justification :

La première commande permet de compter le nombre de mots qui se terminent par -eux. La deuxième commande
relève ces mots de la fichier dico-etiquette.txt et nous permet de voir les catégories grammaticales de ces mots.

Question n°5

Commande tapée avec egrep :


Résultat de la commande

Justification :

L'opérateur de regexp | signifie 'ou' et donc trouve soit les lignes contenant des mots qui se terminent en '-able'
soit les lignes contentant des mots qui se terminent en '-ible'


                                                                                                                         


                                                                                                                                  Retour Haut de page