Retour Partie 2

Exercices


Exercice 1

Dans cet exercice, nous avons travailler sur le document Duchn-isolatin.txt
L'objectif est d'écrire une commande qui permet de filtrer les lignes contenant :

  • des mots commençant par "citoy"


Ici, nous avons utilisé la fonction -c : elle permet de compter les lignes et la fonction -i qui permet de trouver le motif qu'il soit en majuscule ou en minuscule. Ce texte ne comportant pas de majuscule à proprement parler, la fonction -i ne sert à rien. "\b" est l'expression de frontière de mots, c'est elle qui délimite les chaînes de caractères qui forment de mots.


On procède de même pour les questions suivantes.
Dans ce cas, nous avons cherché à afficher l'ensemble des occurences des mots commençant par "aristo" et "bougre".




Dans ce texte, il n'y a pas de majuscule, celles-ci sont représentées par l'intermédiaire de *. On cherche donc des mots commençant par *, comme il s'agit d'un caractère spécial, on utilise \ pour le despécialiser.







Ici, on a utilisé la fonction -n, elle permet d'afficher les lignes qui contiennent le motif en indiquant le numéro de ligne.


  • des séquences de mots comportant une forme négative: ne...pas, n'...pas


Pour trouver les formes négatives, nous recherchons les particules de la négation. Cependant le "ne" de la négation peut etre élidée nous recherchons donc "ne" ou "n' " ce qui nous donne en début d'expression régulière : \bn[e']\b.
Le ".*" correspond a n'importe quels caractères séparant les deux éléments de la négation sachant que ces caractères sont en nombre illimité.



Exercice 2


Les différentes questions portent sur le document Dico.txt

  • Calcul du nombre de mots présents dans le fichier

Pour connaître le nombre de mots dans le fichier dico, on va utiliser la commande wc (comptage des mots) suivi de -w et ensuite on va préciser le fichier dans lequel on travaille. Ici, il a 136252 mots dans le fichier.



  • Extraction des mots terminant par -able


On a utilisé une expression régulière, "able" suivi de \b pour marquer la frontière de mot.

  • Calcul du nombre de mots se terminant par -able


De même, pour compter les mots on utilise la commande wc -w suivi du fichier où l'on a recensé tous les mots finissant par -able (fichier : p1ex2-able.txt). Ici, il y en a 492. Ces mots font partie des adjectifs (exemple : adorable).

Voir le résultat de la commande

  • Extraction et calcul du nombre de mots se terminant par -eux


On a utilisé une expression régulière, "eux" suivi de \b pour marquer la frontière de mot.
Puis pour compter les mots on utilise la commande wc -w suivi du fichier où l'on a recensé tous les mots finissant par -eux (fichier : p1ex2-eux.txt). Ici, il y en a 363. Ce sont soit des noms (ex: des aieux), des adjectifs (ex : astucieux) ou des pronoms (ex : eux, ceux)

Voir le résultat de la commande

  • Extraction des mots se terminant par -able et par -ible


On recherche des mots avec une fin différente (seul le "a" ou le "i" change), on va donc utiliser les crochets [] pour montrer cette variable ensuite inscrire ce qui suit ces deux voyelles "ble" et pour finir mettre \b pour désigner la fin du mot.

Voir le résultat de la commande