Retour Partie 2

Requêtes Text Brut

Exercices sur le Père Duchesne



Les exercices consistaient a écrire des commandes a l'aide des expressions régulières en Cygwin qui filtreraient de différents mots dans le texte sur le Père Duchesne. De plus, pour vérifier les résultats j'ai utilisé le logiciel Antconc.

Il y avait 13 exercices que vous trouverez ci-dessous.

Ecrivez une commande qui permet de filtrer les lignes:

1. contenant des mots commençant par « citoy ».

Voici la commande en Cygwin et les résultats en Antconc:

La combinaison de la barre oblique et de "b" ("\b") permet de trouver tous les mots qui commencent par "citoy" en l'occurrence. Puisqu'on veut trouver les mots avec "citoy" en début de mot suivis des suffixes différents, je n'ai écrit que la racine du motif dans l'expression régulière que j'ai utilisée.

2. contenant des mots commençant par « aristo ».

Voici la commande en Cygwin et le résultat en Antconc:

Pour écrire cette commande j'ai modifié juste la commande précédente et ai remplacé "citoy" par "aristo".

3. contenant des mots commençant par « bougre ».

Voici la commande en Cygwin et le résultat en Antconc:

Pour écrire cette commande j'ai modifié juste la commande précédante et ai remplacé "aristo" par "bougre".

4. qui parlent des « Sans-culottes ».

Voici la commande en Cygwin et le résultat en Antconc:

La commande egrep "culott" permet de trouver ne pas seulement les motifs "sans-culotte(s)" mais également des mots dérivés de "sans-culottes" comme par exemple "sans-culotterie".

5. contenant une majuscule (attention, au format des majuscules dans le texte)

Voici la commande en Cygwin et le résultat en Antconc:

Dans le texte sur lequel on travaille il n'y a pas de majuscules. Elles sont remplacées par une minuscule précédé d'un astérisque (par exemple Paris devient "*paris"). J'ai écrit donc une commande simple qui retrouve les mots contenant un "*".

6. contenant des mots qui se terminent par « er » .

Voici la commande en Cygwin et le résultat en Antconc:

Puisqu'il faut trouver mots qui se terminent par "er" j'ai mis cette fois-ci le "\b" après le motif recherché afin de marquer une frontière de terminaison.

7. contenant des mots qui parlent de « danger ».

Voici la commande en Cygwin et le résultat en Antconc:

Dans le texte "Père Duchesne" tous les mots parlant de "danger" ont la meme racine qui est "danger". On retrouve les mots comme "danger", "dangers", "dangeureuse" et "dangeureux".

8. contenant des mots qui parlent de « patrie ».

Voici la commande en Cygwin et le résultat en Antconc:

J'ai commencé mon expression régulière par le "\b" pour marquer la fronitière du début de mot. Ensuite, j'ai mis "e" et "o" entre crochets pour pouvoir extraire des mots divers liés au terme "patrie". J'ai obtenu par exemple les mots tels que bien sur "patrie et "patries" mais aussi "patriotisme" ou "patriotique".

9. contenant des mots qui parlent de « liberté » .

Voici la commande en Cygwin et le résultat en Antconc:

"\blib" est une expression régulière qui veut dire que le motif "lib" se trouve en début de mot. On retrouve par exemple "libre", "libres" ou "liberté".

10. contenant des mots qui parlent de « temps ». Indiquer dans quels sens ce mot est employé.

Voici la commande en Cygwin et le résultat en Antconc:

Comme dans la commande précédente, le motif se situe après le "\b" qui indique la frontière de début de mot. Cela élimine "longtemps" Ce mot est utilisé pour parler a la fois du temps qui passe et de l'état de l'atmosphère.

11. contenant des mots qui parlent de « république ».

Voici la commande en Cygwin et le résultat en Antconc:

Comme dans la commande précédente, le motif se situe après le "\b" pour indiquer la frontière de début de mot. Pour que le programme puisse prendre en compte toutes les occurrences dans lequelles apparaissent les mots parlant de "république", il faut mettre des caractères "c" (pour le mot comme "républicain") et "q" (de "république") entre crochets. Puisque Cygwin ne reconnait pas les accents, j'ai remplacé "é" par un point.

12. contenant des mots qui parlent de « trahison ».

Voici la commande en Cygwin et le résultat en Antconc:


13. contenant des séquences de mots comportant une forme négative : ne...pas, n’...pas, etc.

Voici la commande en Cygwin et le résultat en Antconc:

Pour cet exercice j'ai utilisé une commande egrep qui pourrait me trouver toutes les occurrences de mots contenant des négations quoi qu'elles soient (ne...pas/ne...personne/ne...jamais/ne...plus etc.). L'expression régulière "\bn['e]\b" est l'une des possiblité pour faire cet exercice et qui veut dire tout simplement : "je cherche les mots commeçant par "ne" ou "n'" \ fin de mot".