Retour Partie 2

Requêtes Text Brut

Exercice 1

1.

A première vue, n'importe quel néophyte aurait envie de prendre les jambes à son cou... Non, non restez là ! Et d'ici peu, vous serez à même de comprendre cette étrange toute petite ligne qui fait de si grande chose...

Tout d'abord, "egrep". Vous retrouverez cette commande maintes et maintes fois dans cette exercice. Il s'agit du nom de la commande que l'on va utiliser.
Ensuite, "-n". C'est une option, dans le sens où l'on n'est pas obligé de la mettre à chaque fois que l'on effectue une commande en egrep. Celle ci permet de spécialiser un peu la commande, en précisant la forme du résultat renvoyé. Ici, on aura les lignes contenant l'occurence recherchée, précédées de leur numéro de ligne dans le corpus.

Juste après, on peut voir l'occurence recherchée, notée à l'aide d'un expression régulière : le "\b" indiquant une frontière de mot, cela indique au programme que l'occurence doit commencer par "citoy". Comme il n'y a rien de précisé à la fin, le programme cherchera tous les mots commencant par cette racine, qu'il y ait ou non une suite de caractère à la suite. Cela signifie que l'on retrouvera sûrement des mots tels que citoyens, citoyenne, citoyenneté... Enfin, "211Rep.txt", est le nom du fichier, sous format .txt, où seront stockés les résultats.

Vous souhaitez voir le résultat de manière concrète ? Résultat obtenu


Il en va de même maintenant pour les questions suivantes :



2.

Pour trouver tous les mots commençant par "aristo" : Résultat en image



3.

Pour trouver tous les mots commençant par "bougre" : Résultat en image



4.

Pour trouver toutes les lignes qui parlent des "sans culottes" : Résultat en image



5.

Pour trouver toutes les lignes contenant une majuscule (il faut alors savoir que dans ce corpus, les majuscules sont notées à l'aide d'une étoile précédant la lettre devant être en majuscule) : Résultat en image



6.

Pour trouver toutes les lignes qui contiennent des mots finissant en "-er" : Résultat en image



7.

Pour trouver toutes les lignes qui parlent de "danger": Résultat en image



8.

Pour trouver toutes les lignes qui parlent de "patrie" : Résultat en image



9.

Pour trouver toutes les lignes qui parlent de "temps" (on remarque que temps est employé ici aussi bien du niveau de la temporalité que pour ce qui concerne la météorologie) Résultat en image



10.

Pour trouver toutes les lignes qui parlent de "république" : Résultat en image



11.

Pour trouver toutes les lignes qui parlent de "trahison" : Résultat en image



12.

Pour trouver toutes les lignes comportant une forme négative (telle que ne pas, ne plus, ni, n' pas...) : Résultat en image