Retour Partie 2

Etude Morphologique

Exercice 1

1. Le nombre de mots dans le fichier : C'est la fonction "wc -l" qui nous permet d'extrayer ce nombre. On demande au logiciel, "wc -l dico.txt", donc d'extraire le nombre de mot du fichier "deco", d'aller le chercher dans le dossier dans lequel il est, et de nous donner le nombre après avoir cliqué sur "entrée".


2. Extraction des termes se terminant par -able: Voici la manière dont ont extrait ces termes. En utilisant la commande "able/b", on lui demande ainsi de prendre tout les termes qui se finissent par -able, à travers le /b, toujours dans le fichier "dico.txt" qu'on a spéfifié dans notre dossier plus tôt.


3. Le nombre de mots se terminant par -able: Grâce à la commande | (touche alt Gr+6 de votre clavier) et wc -c ajoutés à la ligne précédente (ex n°2), on obtient le nombre de termes se terminant par -able.


Et ce n'est pas tout ! Grâce à la commande "able_.+\b", on peut obtenir aisément à quelle partie du discours ces termes sont rattachés !!!



Ainsi, on remarque que "séparable" est un adjectif et ainsi de suite, au fil des termes qui s'affichent, à côté d'eux s'affiche en abréviations du partie du discours auquel ils sont rattachés.
NB : Le fichier a été ouvert à partir de "dico-etiquette" qui se trouve toujours dans le même dossier.

4. Le nombre de mots se terminant par -eux: (Même explication que pour la question précédente.)




5. La commande permettant d'extraire à la fois -able et -ible : Une autre des commandes egrep, qui permet donc d'extraire des mots dont la terminaison est différente. Grâce aux [] -crochets donc, on peut demander à egrep de nous extraire la terminaison en -i ou bien en -a, qui sont les deux suivi de -ble. On peut ajouter la barre | qui permet d'indiquer le "ou bien". Et ce, dans notre fichier dico.txt qu'il faut toujours préciser à la fin.


L'informatique, c'est MAGIQUE !!!