Retour Partie 2

par Caroline Robitaillié.


        Exercices Text Brut


    Dans cet exercice, nous avons travaillé sur le document Duchn-utf8.txt. Nous devions, à l'aide de la commande egrep, de la commande wc et de la fenêtre de commande Cygwin, faire apparaître les lignes :


    > contenant des mots commençant par "citoy" :



Dans cette commande, \b signifie que l'on s'intéresse aux frontières de mot et plus particulièrement celle du début.

             Fichier obtenu ici

    > contenant  des mots commençant par "aristo" :



Dans cette commande, \b matérialise le début de mot.

             Fichier obtenu ici

    > contenant des mots commençant par "bougre" :



             Fichier obtenu ici

    > qui parlent des "sans-culottes" :



             Fichier obtenu ici

    > contenant une majuscule :



Dans cette commande, on utilise le \ pour inhiber la fonction d'opérateur numérique de *. Par ailleurs, dans ce texte, les majuscules sont matérialisées par une * donc, on utilise * comme le signe étoile et non comme le signe multiplié.

            
Fichier obtenu ici

     > contenant des mots qui se terminent par "-er" :



            
Fichier obtenu ici

     > contenant des mots qui parlent de "danger" :




             Fichier obtenu ici

    > contenant des mots qui parlent de "patrie" :



             Fichier obtenu ici

    > contenant des mots qui parlent de "liberté" :



             Fichier obtenu ici

    > contenant des mots qui parlent de "temps" :



             Fichier obtenu ici

    > contenant des mots qui parlent de république :



             Fichier obtenu ici

    > contenant des mots qui parlent de "trahison" :



             Fichier obtenu ici

    > contenant des séquences de mots comportant des formes négatives (ne ... pas, n'... pas, etc.) :



Dans cette commande, on choisit de repérer les lignes comportant des mots avec soit e soit ' après le n, d'où : n['e].

             Fichier obtenu ici