Retour Partie 2

Requêtes Text Brut

Question 1


Des mots commençant par « citoy » : egrep désigne que l'on se sert des expressions régulières "\bcitoy" est le motif recherché, \b désignant la frontière de mot et citoy la chaine de caractère recherchée. Duchn-utf8.txt désigne le fichier de recherche. > e1-q1.txt désigne que le résultat doit être enregistré dans un fichier txt créer par le programme.

Résultat

Question 2


Des mots commençant par « aristo » : même principe que pour la question 1

Résultat

Question 3


Des mots commençant par « bougre » : même principe que pour la question 1

Résultat

Question 4


Qui parlent des « Sans-culottes » : même principe que pour la question 1 sauf que nous recherchons directement une chaîne de caractères.

Résultat

Question 5


Contenant une majuscule : Le fichier ne contenant pas de majuscules mais celle-ci étant repéré grâce à une * placée avant le mot. L'expression régulière se décompose donc ainsi : \ pour retirer son caractère d'expression régulière au caractère suivant * qui est dons l'étoile qui précède les mots avec une majuscule, le . précise qu'il est suivit de n'importe quel caractère et le + qu'il s'agit d'une ou plusieurs occurence.

Résultat

Question 6


Des mots qui se terminent par « er » : même principe que pour la question 1

Résultat

Question 7


Des mots qui parlent de «danger » : Si l'on considère que les mots qui parlent de danger peuvent être : danger, dandereux, dangerosité, dangereuse ... On peut alors définir l'expression régulière \b pour marquer la frontière de mot, danger pour la chaîne de caractère commune à toutes les entrées possibles et [oe] est une classe qui indique que la chaîne de caractère peut être suivie d'un o ou d'un e.

Résultat

Question 8


Des mots qui parlent de « patrie » : même principe que pour la question 7 avec comme mots pouvant parler de patrie : patrie, patriote, patriotisme, patriotique.

Résultat

Question 9


Des mots qui parlent de « liberté » : même principe que pour la question 7 avec comme mots pouvant parler de liberté : liberté, libre.

Résultat

Question 10


Des mots qui parlent de « temps » dans le sens de la durée : même principe que pour la question 7 avec comme mots pouvant parler de temps : temps, temporalité, temporaire, temporairement ...

Résultat

Question 11


Des mots qui parlent de « république » : même principe que pour la question 7 avec comme mots pouvant parler de république : république, républicain, républicaine.

Résultat

Question 12


Des mots qui parlent de « trahison » : même principe que pour la question 7 avec comme mots pouvant parler de trahison : trahison, trahir.

Résultat

Question 13


Des séquences de mots comportant une forme négative : la forme négative se compose de deux éléménts, un premier commençant toujours par n avec soit un e, un i ou une ' ce que l'on traduit dans l'expression régulière par n[e'i]. L'espace suivit du ? marque qu'après cette forme il peut y avoir soit un espace soit pas, le ? marquand zéro ou une occurence de ce qui précède. Les parenthèses encadrent les instructions. Dans la première parenthèse, \b marque la frontière du mot, \w sélectionne n'importe lettre accentuée ou chiffre et le + indique qu'il peut y avoir un ou plusieurs caractères. L'instruction se termine par un espace avant que la parenthèse ne soit refermée. Le * indique que toute l'opération contenue dans la parenthèse peut être réalisée zéro, une ou plusieurs fois. Cette parenthèse permet donc de préciser qu'il peut y avoir des mots entre les différentes parties de la négation. Dans la deuxième parenthèse se trouve les chaînes de caractères qui peuvent constituer la deuxième partie de la négation. Nous avons défini quatre possibilité "pas", "point", "plus" et "jamais". Chacune de ces possibilités est encadré de deux frontières de mots \b et séparé par | indiquant l'alternative, le choix.

Résultat