Exercice: Analyse morphologique

Question 1: Combien y a-t-il de mots dans le fichier ?

Dans ce fichier, il y a 136 252 mots.

Question 2: Quels sont les mots se terminant par "-able" ?

Voici la commande qui permet de répondre à cette question : egrep "able\b" dico.txt.



Question 3: Combien y a-t-il de se terminant par "-able" ?

Dans ce fichier, il y a 492 mots se terminant par la syllabe "-able". La commande suivante nous permet de trouver ce résultat: egrep -c "able_.*\b" dico-etiquette.txt.


Question 4: A quelle partie du discours ces mots appartiennent-ils ?

Utilisons alors la commande suivante: egrep "able_.*\b" dico-etiquette. Le résultat de cette commande est :


Question 5: Combien y a-t-il de mots se terminant par "-eux"?

Dans ce fichier, il y 363 mots se terminant par la syllabe "-eux". Afin de trouver ce résultat, voici la commande qu'il convient d'utiliser: egrep -c "eux_.*\b" dico-etiquette.txt.

Question 6: A quelle partie du discours ces mots appartiennent-ils ?

Afin de répondre à cette question, il faut utiliser la commande qui suit: egrep "eux_.*\b" dico-etiquette.

Question 7: Quelle est la commande permet à la fois d'extraire les mots se terminant par la syllabe "-able" et ceux se terminant par la syllabe "-ible" ?

La commande permettant d'extraire ces suffixes est celle-ci: egrep "ible\b|able\b" dico.txt. E



Pour retourner à la partie 2: Modélisation XML, cliquez ici