Exercice 1 : travail avec le texte "Père Duchène".



Question n°1: Commande permettant de filtrer les lignes contenant des mots commençant par « citoy ».

test


Cliquez pour visualiser le résultat de la commande.


Question n°2: Commande permettant de filtrer les lignes contenant des mots commençant par « aristo ».



Cliquez pour visualiser le résultat de la commande.


Question n°3: Commande permettant de filtrer les lignes contenant des mots commençant par « bougre »



Cliquez pour visualiser le résultat de la commande.


Question n°4: Commande permettant de filtrer les lignes contenant des mots qui parlent des « Sans-culottes »



Cliquez pour visualiser le résultat de la commande.


Question n°5: Commande permettant de filtrer les lignes contenant des mots contenant une majuscule


Cliquez pour visualiser le résultat de la commande.


Question n°6: Commande permettant de filtrer les lignes contenant des mots qui se terminent par « er »


Cliquez pour visualiser le résultat de la commande.


Question n°7: Commande permettant de filtrer les lignes contenant des mots qui parlent de «danger »


Cliquez pour visualiser le résultat de la commande.


Question n°8: Commande permettant de filtrer les lignes contenant des mots qui parlent de «patrie »


Cliquez pour visualiser le résultat de la commande.


Question n°9: Commande permettant de filtrer les lignes contenant des mots qui parlent de « liberté »


Cliquez pour visualiser le résultat de la commande.


Question n°10: Commande permettant de filtrer les lignes contenant des mots qui parlent de « temps »


Cliquez pour visualiser le résultat de la commande.


Question n°11: Commande permettant de filtrer les lignes contenant des mots qui parlent de « république »


Cliquez pour visualiser le résultat de la commande.


Question n°12: Commande permettant de filtrer les lignes contenant des mots qui parlent de « trahison »


Cliquez pour visualiser le résultat de la commande.


Question n°13: Commande permettant de filtrer les lignes contenant des séquences de mots comportant une forme négative : ne...pas, n’...pas, .... »


Cliquez pour visualiser le résultat de la commande.



Exercice n°2 Etude morphologique

Question n°1:
Commande permettant de trouver le nombre de mots dans le fichier.
On recherche tout motif qui commence par une lettre comprise entre A et z, il suffit de compter pour obtenir le nombre total de mots dans le dictionnaire.

{egrep -c "\b[A-z]" dico.txt}
Cliquez pour visualiser le résultat de la commande.


Question n°2: Commande permettant d'extraire les mots se terminant par -able.
On utilise la fonction -i pour extraire les mots.

{egrep -i "able\b" dico.txt}
Cliquez pour visualiser le résultat de la commande.


Question n°3: Commande permettant d'extraire le nombre de mots se terminant par -able et leur partie du discours.
On utilise la fonction -c pour compter.

{egrep -c "able\b" dico.txt}
Cliquez pour visualiser le résultat de la commande.


Question n°4: Commande permettant d'extraire le nombre de mots se terminant par -eux et leur partie du discours.
On utilise la fonction -c pour compter.

{egrep -c "eux\b" dico.txt}
Cliquez pour visualiser le résultat de la commande.


Question n°5:Comment permettant de trouver les mots se terminant par -able, et, ceux se terminant par -ible.
On recherche tous les motifs "-able" et "-ible".

{egrep -i "[ai]ble\b" dico.txt}
Cliquez pour visualiser le résultat de la commande.



Exercice 3 : Construire des entrées structurées de dictionnaire.

a) Naviguer dans le TLFI et choisir 10 entrées.
Dans notre cas nous avons opté pour des exemples d'oiseaux. (cliquez sur les noms pour obtenir la défintion TLFI)

lagopède
rossignol
pie
pigeon
moineau
tourterelle
corbeau
rouge-gorge
cigogne
mouette

b) Dessiner une arborescence pour décrire ces données :



c) Construire une représentation structurée des entrées par un balisage XML.
Changement de l'extension du fichier .txt en .xml
Cliquez ici pour la forme .txt
Cliquez ici pour voir le résultat du balisage xml

d) Verfifier la bonne formation du fichier complet et éventuellement apporter les corrections nécessaires.
En ouvrant le fichier avec firefox, celui-ci peut rencontrer des problèmes, en effet si certaines de mes balises étaient non conforme au balisage XML, par exemple: "<ARTICLE/>" ; "<ETYMOLOGIE + CATEGORIE>", je peux avoir des messages d'erreurs tels que:

après la correction, voici le résultat obtenu: voir dans c) ou ici