Retour Partie 2

Lors du TD nous avons travaillé sur un texte du Père Duchesne au nom de Duchn-utf8.txt

Les différentes commandes :

Egrep est une commande UNIX de filtrage ayant une syntaxe particulière : egrep[options]motif + nom du fichier

Permet de filtrer les mots commençant par "citoy"


Permet de filtrer les mots commençant par "aristo"

Permet de filtrer les lignes ayant une majuscule

Permet de filtrer les lignes contenant le mots "citoyen"

Permet de filtrer les lignes contenant une négation

Permet de filtrer les mots se finissant par "-er"

Les commandes mises en pratique :


Exemple 1 : Avec un logiciel AntCon nous avons affiché les phrases contenant le mot "aristocrate" dans notre fichier Duchn-utf8. Ce logiciel permet d'écrire soit la commande egrep ou en précisant les premiers termes du mot aristo*. Ce logiciel nous précise combien de fois le mot "aristo" apparaît dans le texte.

Exemple 2 : Avec le même logiciel et à l'aide de notre commande egrep nous avons affiché les phrases contenant une négation (quelque soit sa forme).Précisons qu'il y a 3261 marques de négation dans notre fichier.txt.


Exemple 3: Nous voulions ordonner dans une liste les mots du texte (dico.txt) se finissant par -able. La commande est : egrep"able\b"dico.txt

Exemple 4 : Avec la commande egrep affichant les mots finissant par -er ("er\b"), voici ce que le logiciel a trouvé (3646 mots).

Exemple 5 :Avec le logiciel AntCon nous avons affiché les mots commençant par cotoy- dans le texte. Pour cela nous pouvions écrire la commande egrep ou comme sur l'image écrire seulement les premiers termes du mot "citoy-".