Retour Partie 2

Requêtes Text Brut

Exercie 1

L'exercie 1 consiste à travailler sur le texte brut du poème Le dormeur du Val de Arthur Rimbaud. Le but avec EGREP est d'extraire les mots ou de trouver le nombre de mot qu'exigeait la consigne.

        Pour rechercher des mots commençant par :

1) "citoy" nous utilisons l'expression egrep "\bcitoy" duchn-utf8.txt

 .


2) "aristo" nous utilisons l'expression egrep "\baristo" duchn-utf8.txt


3) "bougre" nous utilisons l'expression egrep "\bbougre" duchn-utf8.txt


      On remarque que l'expression pour rechercher des mots commençant par un préfixe X est la même à chaque fois, c'est à dire "\b". Cette expression régulière permet de rechercher les mots ayant un début délimité.


4) Pour rechercher des mots qui parlent des sans-culottes nous utlisons l'expression
egrep "\bsans-culotte" duchn-utf8.txt

      -> "\b" permet de trouver les mots començant par "sans-culotte" dans le fichier voulu, qui est "duchn-utf8.txt" .


5) Pour rechercher des mots contenant une majuscule nous utilisons l'expression egrep "\*" duchn-utf8.txt


    -> Ce texte, les majuscules sont représentées par un astérisque placé devant le mot, c'est pourquoi nous recherchons des mots avec un astérisque placé devant.

6) Pour rechercher les lignes contenants des mots qui se terminent pas "-er", nous utilisons egrep "er\b" duchn-utf8.txt
    -> L'expression régulière "\b" permet de délimiter la fin du mot. Ici EGREP ne recherche que les mots ayant une fin délimitée par "er".


7) Pour rechercher les lignes contentant des mots qui parlent de danger nous utilisons l'expression egrep "danger" duchn-utf8.txt.
   
-> Ici, EGREP ne recherche que le terme entre guillemet, qui est "danger".


8) Pour rechercher les lignes qui parlent de patrie nous utilisons l'expression egrep "patri" duchn-utf8.txt


9) Pour rechercher les lignes contenant des mots qui parlent de liberté, nous utilisons l'expression egrep "\blib" duchn-utf8.txt


10) Pour rechercher les lignes contenant des mots qui parlent de temps, nous utilisons l'expression egrep "temps" duchn-utf8.txt


11) Pour rechercher les lignes contenant des mots qui parlent de république, nous utilisons l'expression egrep "r.publi" duchn-utf8.txt


12) Pour rechercher les lignes contenant des mots qui parlents de trahison, nous utlisons l'expression egrep "tra" duchn-utf8.txt


13) Pour rechercher les lignes qui contiennent des séquences de mots contenant une forme négative : ne .. pas, n'..pas etc., nous utilisons l'expression egrep "\bn['e]\b" duchn-utf8.txt


.....