Retour Partie 2

Etude Morphologique

Nous allons faire une analyse morphologique du fichier dico.txt. Petite précision : comme son nom l'indique, c'est un lexique.


1) Combien y a-t-il de mots dans ce fichier ?

Il y a 136 252 mots dans le fichier dico.txt. La commande wc (word counter) permet de compter le nombre de mots d'un fichier.


2) Comment extraire les mots se terminant par -able ?

Clic clic pour voir la liste

On indique entre guillemets "" ce que l'on veut extraire. \b indique une frontière de mot, ici la fin.


3) Combien y a-t-il de mots terminés par -able ?

La commande -c sert à compter le nombre de mots. Elle compte 492 mots se terminant par "-able" dans le fichier dico.txt.


4) Combien y a-t-il de mots terminés par "-eux" dans ce fichier ?

On utilise la même commande -c pour compter les mots. Elle nous donne un résultat de 363 mots se terminant par "-eux" dans le fichier dico.txt.


5) Quelle commande permet d'extraire à la fois les mots se terminant par -able et ceux se terminant par -ible ?

Clic clic encore pour voir la liste

On indique entre guillemets "" ce que l'on veut extraire. Comme on veut à la fois des mots se terminant par "-able" et par "-ible" on indique le segment pouvant alterner entre crochets []. \b indique une frontière de mot, ici la fin. Ce qui nous donne comme expression egrep "[ia]ble\b"