PARTIE 2

2.1 Exercices sur le « Père Duchesne »

Ecrire une commande qui permet de filtrer les lignes

• contenant des mots commençant par « citoy ».

commentaire:  "egrep" nous permet de rechercher dans des fichiers des lignes contenant un motif donné; "-i" signifie "ignorer masculin ou féminin"; "\b" : reconnaissance en bord de mot. 

1.Résultat
• contenant des mots commençant par « aristo ».

commentaire:  "-i" signifie "ignorer masculin ou féminin"; "\b" : reconnaissance en bord de mot.

2.Résultat
• contenant des mots commençant par « bougre ».

commentaire:  "-i" signifie "ignorer masculin ou féminin"; "\b" : reconnaissance en bord de mot.

3.Résultat
• qui parlent des « Sans-culottes » .

commentaire:  "-i" signifie "ignorer masculin ou féminin";  "\" anti-slash utilisé comme barre d'échappement et de déspécialisation, puisque ici on doit déspécialiser *, il s'agit du symbole *, mais pas * qui répète le caractère précédent. Dans le texte tout le "sans-culottes" contient le symbole * , donc cette commande est suffisante.

4.Résultat
• contenant une majuscule (attention, au format des majuscules dans le texte)

commentaire:  dans le texte la majuscule est caractérisée par le symbole *, "\" anti-slash utilisé comme barre d'échappement et de déspécialisation

5.Résultat
• contenant des mots qui se terminent par « er » .

commentaire:   "\b" : reconnaissance en bord de mot.

6.Résultat
• contenant des mots qui parlent de «danger » .

commentaire:   "\b" : reconnaissance en bord de mot. -i : permet de ne pas tenir compte de la différence entre
minuscules et majuscules

7.Résultat


• contenant des mots qui parlent de «patrie ».

commentaire:   -i : permet de ne pas tenir compte de la différence entre
minuscules et majuscules;
"\b" : reconnaissance en bord de mot. On cherche la racine "patri", <o|e> c'est-à-dire la fin peut être o ou e

8.Résultat


• contenant des mots qui parlent de « liberté » .

commentaire:   "\b" : reconnaissance en bord de mot. On lance la recherche à partir de la racine lib pour obtenir maximum de résultat

9.Résultat


• contenant des mots qui parlent de « temps ». Indiquer dans quels sens ce mot est employé.

commentaire:   "\b" : reconnaissance en bord de mot.

10.Résultat


• contenant des mots qui parlent de « république ».

commentaire: "egrep" nous permet de rechercher dans des fichiers des lignes contenant un motif donné; "-i" signifie "ignorer masculin ou féminin"; "\b" : reconnaissance en bord de mot. 

11.Résultat
• contenant des mots qui parlent de « trahison ».

commentaire: "egrep" nous permet de rechercher dans des fichiers des lignes contenant un motif donné; "-i" signifie "ignorer masculin ou féminin"

12.Résultat
• contenant des séquences de mots comportant une forme négative : ne...pas, n’...pas, ....

commentaire: "egrep" nous permet de rechercher dans des fichiers des lignes contenant un motif donné; "-i" signifie "ignorer masculin ou féminin", la forme négative a plusieurs possibilités: ne...pas, ne...plus

13.Résultat

2.2 Etude morphologique

1. Combien de mots dans le fichier ?

commentaire: -c : affiche un décompte des lignes comprenant le motif cherché; "." va remplacer n'importe quel caractère; le texte ciblé est dico.txt


2. Avec la commande egrep extrayez les mots se terminant par -able. (Indiquez la ligne de commande).

Pour consulter la page de résultat, cliquer ici

3. Combien y a-t-il de mots terminés par -able ? A quelle(s) partie(s) du discours sont-il rattachés ?

Pour consulter la page de résultat, cliquer ici

commentaire:  -ic, c'est-à-dire afficher un décompte des lignes comprenant le motif cherché en ignorant le masculin et le féminin; pour la deuxième question, on peut voir -able comme un adjectif 467 fois, verbe 2 fois, nom 23 fois et adverbe 0, donc les mots sont rattachés à partie adj, ver, nom

4. Même question pour -eux.

Pour consulter la page de résultat, cliquer ici

commentaire: Même comme -able
5. Quelle commande permet d'extraire à la fois les mots se terminant par -able et ceux se terminant par -ible:
abominable
abordable
accable
acceptable
accessible
achetable
adaptable
admirable
admissible
...

Pour consulter la page de résultat, cliquer ici

commentaire: [ai] nous permet d'avoir une alternance de a ou i