PARTIE 3 (egrep)

Utilisation TextUtils

Niveau 0

Télécharger les textes de travail

Textes de travail : index des mots du corpus prématurés.
On trouvera dans l'archive précédente un fichier regroupant l'ensemble des mots du corpus (un par ligne).

1. Déterminer les différentes catégories présentes dans le corpus (leur nombre et leur fréquence)

Pour déterminer les différentes catégories présentes dans le corpus (leur nombre et leur fréquence), il faut utiliser cette ligne de commande :
egrep -o -i "_[A-Z][A-Z][A-Z]$" liste-mots-utf-8.txt | sort | uniq -c| sed "s/\_//" | sort -u

2. Pour chaque catégorie déterminer tous les mots associés.

Retourner en haut de la page

Précédent Suivant

Maitrise des Outils Linguistiques