Retour à Modélisation XML

Requêtes sur le texte du Père Duchesne

Pour trouver les lignes qui :

- contiennent des mots commençant par "citoy", "aristo" et "bougre"

resultats1

Les motifs recherchés sont des chaînes qui doivent être présentes en début de mot : on les fait donc précéder de "\b" pour signifier la frontière de mot. La première commande utilise la redirection ">" pour créer le fichier, les suivantes utilisent ">>" pour ne pas écraser les données précédentes. (voir le script de résultats)

- parlent des Sans-culottes, de danger, de patrie, de liberté, de temps, de république et de trahison

resultats2

Ici les motifs sont moins stricts, il faut donc préciser les alternatives : Sans-culotte avec ou sans majuscule, la famille du mot "patrie" (patrie, patriote, patriotique...), la famille du mot "liberté" (liberté, libre, libéré, libéral...), la famille du mot "république" (république, républicain) avec ou sans accent, la famille du mot "trahison" (trahison, traître, trahi...) mais en évitant les mots "traitant", etc. (voir le script de résultats)

- contiennent des mots commençant par une majuscule, finissant par -er, contenant une négation

resultats3.png

Les majuscules sont notées dans le texte par un "*" précédant le caractère, il nous faut donc chercher les lignes contenant un "*". Dans la commande, un "\" vient échapper ce caractère spécial. La négation peut apparaître sous plusieurs formes : "ne", "ni" ou "n'", on précise donc les alternatives. (voir le script de résultats)