Étape 3

Mise en forme du fichier Cordial

Les fichiers manipulés dans cette étape ont été créés suivant les instructions du polycopié.

# pipe du fichier brut produit par cordial et mkcorpus
cat res-cordial.txt |
#       mettre tout sur une ligne
tr "\n" " " |
#       insérer des retour-chariots avant les balises
sed -e "s/</\n</g" |
#       n'afficher que les lignes non-vides
egrep -e "." |
#       n'afficher que les adjectifs qui nous intéressent
egrep -e "\btonique[_]|\bcalme[_]|\bprésent.\?[_]|\bquatre[_]|\bautre[_]" >
#       enregistrer le résultat
cordial.txt