Retour Partie 2

Requêtes Text Brut

Dans la première partie, l'étude morphologique, nous avons travaillé sur le texte sur le "Père Duchesne", qui concernait la Révolution Française. Dans un premier exercice, il a fallu écrire divers commandes egrep dans Cygwin. Cygwin est une émulation d'une fenêtre de commande Unix pour pouvoir en utiliser les commandes sur une système d'exploitation Windows.


Nous avons principalement utilisé quatre commandes, sachant que pour la quatrième nous pouvions y rajouter des options. Ces commandes sont pwd, cd, wc et egrep. J'ai choisi d'enregistrer le résultat de ces filtrages succesifs dans des fichiers .txt comme l'indiquent les séquences "> ... .txt"


  • Ecrire une commande qui permet de filtrer les lignes contenant des mots commençant par « citoy ».


  • Ecrire une commande qui permet de filtrer les lignes contenant des mots commençant par « aristo ».


  • Ecrire une commande qui permet de filtrer les lignes contenant des mots commençant par « bougre ».


  • Ecrire une commande qui permet de filtrer les lignes qui parlent des « Sans-culottes ».


  • Ecrire une commande qui permet de filtrer les lignes contenant une majuscule. Il fallait faire attention au format de celles-ci dans le texte.


  • Ecrire une commande qui permet de filtrer les lignes contenant des mots qui se terminent par « er ».


  • Ecrire une commande qui permet de filtrer les lignes contenant des mots parlent de « danger ».


  • Ecrire une commande qui permet de filtrer les lignes contenant des mots parlent de « patrie ».


  • Ecrire une commande qui permet de filtrer les lignes contenant des mots parlent de « liberté ».


  • Ecrire une commande qui permet de filtrer les lignes contenant des mots parlent de « temps>


  • Ecrire une commande qui permet de filtrer les lignes contenant des mots parlent de « république ».


  • Ecrire une commande qui permet de filtrer les lignes contenant des mots parlent de « trahison ».


  • Ecrire une commande qui permet de filtrer les lignes contenant des séquences de mots comportant une forme négative.


En complément, nous devions aussi travailler en parallèle avec le logiciel Antconc, qui permettait d'obtenir les mêmes résultats de recherche, toutefois mieux présentés. Voici donc une capture d'écran pour la première des expressions régulières que j'ai testées. Elle permettait, je le rappelle, de filtrer les lignes contenant des mots commençant par « citoy ».