Retour Partie 2

Exercice texte sur le "Père Duchesne"

Q.1) Commande pour extraire les mots commençant par "citoy" : egrep "\bcitoy" Duchn-utf8.txt
         \b signifie une frontière de mot, on l'utilise pour extraire seulement les mots commençant par "citoy".

Q.2) Commande pour extraire les mots commençant par "aristo": egrep "\baristo" Duchn-utf8.txt

Q.3) Commande pour extraire les mots commençant par "bougre" : egrep "\bbougre" Duchn-utf8.txt

Q.4) Commande pour extraire les mots qui parlent de "sans-culottes" on tape "culott" et cela va prendre en compte tous les mots avec et sans majuscule : egrep "culott"                          Duchn-utf8.txt

Q.5) Commande pour extraire les lignes commençant par une majuscule : egrep \*\b\w+\b" Duchn-utf8.txt
          Dans le texte, l'étoile est utilisé pour marquer un mot qui devrait commencer par une majuscule, \w est le caractère de mot, et \b la frontière de mot.

Q.6) Commande pour extraire les mots qui se terminent par "er" : egrep "\w*er\b" Duchn-utf8.txt
         Ici, l'étoile représente n'importe quel nombre de caractère qui précède "er".

Q.7) Commande pour extraire les mots qui parlent de "danger": egrep "\bdang[ere][er]" Duchn-utf8.txt
         [] permet ici d'extraire tous les mots qui parlent de danger, et qui ont une terminaison différente.

Q.8) Commande pour extraire les mots qui parlent de "patrie" : egrep "\bpatri\w+\b" Duchn-utf8.txt
        Ici, \w+ permet d'extraire tous les mots commençant par "patri" et qui ont n'importe qulle terminaison.

Q.9) Commande pour extraire les mots qui parlent de "liberté" : egrep "\b lib[re][er]" Duchn-utf8.txt

Q.10) Commande pour extraire les mots qui parlent du "temps" : egrep "\btemp\w+\b" Duchn-utf8.txt
           Ici, \w+ marque tous les occurences qui commencent par "temp" et qui ont n'importe quelle temperature.

Q.11) Commande pour extraire les mots qui parlent de "république" : egrep "républi[q|c]" Duchn-utf8.txt
           | marque le choix, "q" ou "c" et [] marque ces différentes possibilités.

Q.12) Commande pour extraire les mots qui parlent de "trahison" : egrep "\btrahi\w+\b" Duchn-utf8.txt

Q.13) Commande pour extraire les lignes contenant des séquences de mots à forme négative : egrep "n[e' ] ? <\b\w+\b >*<\bpas\b|\bpoint\b|\bplus\b>" Duchn-utf8.txt