Exercice n°2


Cet exercice est lui aussi réalisé avec le logiciel Cygwin et les commande egrep.
Les corpus que nous avons utilisé: dico.txt et dico-etiquette.txt

Question n°1: Combien de mots dans le fichier ?

Ici on utilise les commandes du logiciel Cygwin. "wc" indique que l'on utilise une commande du logiciel et "-w" est la commande pour avoir le nombre de mots du fichier.

Résultat obtenu


Question n°2: Commande egrep permettant d'extraire les mots se terminant par -able.

Ici on utilise l'expression régulière \b après la chaîne de caractères car on recherche des mots se terminant par "able".

Résultat obtenu


Question n°3: Combien y a-t-il de mots terminés par -able ?

Ici on utilise encore les commandes de Cygwin pour avoir le nombre de mots se trouvant dans le fichier "rep2ex2.txt".

Résultat obtenu


A quelle(s) partie(s) du discours sont-il rattachés ?

Ici on ajoute le caractère "_" au radical "able" car dans le fichier "dico-etiquette.txt" après ce caractère on trouve la catégorie du mot. Ainsi on remarque que les mots se terminant par "able" sont majoritairement des adjectifs, même s'il ya aussi quelques noms et quelques verbes.

Résultat obtenu


Question n°4: Commande egrep permettant d'extraire les mots se terminant par -eux.

Ici on utilise l'expression régulière \b après la chaîne de caractères car on recherche des mots se terminant par "eux".

Résultat obtenu


Combien y a-t-il de mots terminés par -eux ?

Ici on utilise encore les commandes de Cygwin pour avoir le nombre de mots se trouvant dans le fichier "rep4ex2.txt".

Résultat obtenu


A quelle(s) partie(s) du discours sont-il rattachés ?

On ajoute le caractère "_" au radical "eux" car dans le fichier "dico-etiquette.txt" après ce caractère on trouve la catégorie du mot. Ainsi on remarque que les mots se terminant par "eux" sont majoritairement des adjectifs, mais on retrouve aussi pas mal de nom.

Résultat obtenu


Question n°5: Quelle commande permet d'extraire à la fois les mots se terminant par -able et ceux se terminant par -ible:

Ici on utilise l'expression régulière \b après la chaîne de caractères pour indiquer qu'on recherche des mots se terminant par le segment "ble" précédé de "a" ou de "i".

Résultat obtenu