Travail de TD

Partie 1

Exercise n°1
Exercise n°2

Partie 2

Exercise n°1

Partie 1: Exercise n°1

Documents utilisés

Discours du Père Duchesne

Question n°1

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

Cette commande trouve les lignes qui contiennent les mots commençant par "citoy". Par exemple,
"citoyen" ou "citoyenneté"

Question n°2

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

Cette commande trouve les lignes qui contiennent les mots commençant par "aristo," comme, par exemple,
"aristocratie" ou "aristocrat", en utilisant l'opérateur de regex \b qui indique les frontières des mots.

Question n°3

Commande tapée avec egrep:

Résultat de la commande

Justification de la commande:

Cette commande cherche les lignes qui contiennent des mots commençant par "bougre" grâce à l'opérateur \b.

Question n°4

Commande tapée avec egrep:

Résultat de la commande

Justification de la commande:

On essaie de trouver les lignes parlant de "sans-culottes" et donc il suffit de trouver des instances du
mot (ou partie de mot) "culotte" pour trouver tous les mots dérivés de "sans-culotte" comme "sans-culotterie."

Question n°5

Commande tapée avec egrep:

Résultat de la commande

Justification de la commande:

Le texte dans le fichier duchn.txt est écrit sans majuscules, mais les mots qui doivent avoir une lettre
majuscule sont marqués par *. Parce que ce symbole est en fait un opérateur en regexp, il faut annuler sa fonction
avec '\' pour pouvoir le traiter comme une chaîne de caractères et non pas comme un opérateur.

Question n°6

Commande tapée avec egrep:

Résultat de la commande

Justification de la commande:

Cette commande cherche les lignes qui contiennent des mots qui se terminent avec 'er'

Question n°7

Commande tapée avec egrep:

Résultat de la commande

Justification de la commande:

Pour trouver les mots qui parlent de 'danger' il suffit de chercher les mots commençant par 'dang.'

Question n°8

Commande tapée avec egrep:

Résultat de la commande

Justification de la commande:

Il y a beaucoup de mots qui se dérivent de 'patrie,' mais il ne suffit pas de chercher les mots commençant
par 'patri' parce qu'on trouvera des mots comme 'patriarche' qui n'ont rien à voir avec 'la patrie'. Donc il faut
créer une expression régulière qui cherche tous les mots commençant par 'patri' SAUF ceux dont la prochaine
lettre est 'a' et on n'aura comme résultat que les mots dans le même champ léxicale que 'patrie.'

Question n°9

Commande tapée avec egrep:

Résultat de la commande

Justification de la commande:

Tous le mots parlant de 'liberté' commencent soit par 'libr' soit par 'liber,' donc l'expression régulière ici
cherche les mots qui commençent par 'lib' et qui ont comme prochaine caractère soit un 'r' soit un 'e.'

Question n°10

Commande tapée avec egrep:

Résultat de la commande

Justification de la commande:

On cherche avec cette commande les mots qui contiennent le texte 'temps'. Dans ce fichier, Le mot 'temps' est
utilisé dans les deux sens de 'état de l'atmosphère' et 'durée'

Question n°11

Commande tapée avec egrep:

Résultat de la commande

Justification de la commande:

Parce que cygwin ne reconnait pas les caractères accentés, on doit remoplacer le 'é' dans le mot 'république' avec
un point qui signifie un caractère quelconque.

Question n°12

Commande tapée avec egrep:

Résultat de la commande

Justification de la commande:

Pour trouver les mots qui parlent de 'trahison', il suffit de chercher les mots commençant par 'trahi' pour trouver
tous les mots appropriés comme 'trahir.'

Question n°13

Commande tapée avec egrep:

Résultat de la commande

Justification de la commande:

Pour trouver les constructions négatives dans le texte, il suffit de chercher le mot 'ne' ou bien 'n''.

vers le haut de la page

vers le début d'exercise 1


Partie 1: Exercise n°2

Documents utilisés

dico.txt
dico-etiquette.txt

Question n°1

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

Avec la commande wc on peut compter tous les mots dans une fichier. Dans ce cas, le résultat est 136252 mots.

Question n°2

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

L'opérateur \b permet de délimiter les frontiers des mots. Avec la commande ci-dessus, on trouve des mots avec
-able à la fin.

Question n°3

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

La première commande permet de compter le nombre de mots qui se terminent par -able. La deuxième commande
relève ces mots de la fichier dico-etiquette.txt et nous permet de voir les catégories grammaticales de ces mots.

Question n°4

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

La première commande permet de compter le nombre de mots qui se terminent par -eux. La deuxième commande
relève ces mots de la fichier dico-etiquette.txt et nous permet de voir les catégories grammaticales de ces mots.

Question n°5

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

L'opérateur de regexp | signifie 'ou' et donc trouve soit les lignes contenant des mots qui se terminent en '-able'
soit les lignes contentant des mots qui se terminent en '-ible'

vers le haut de la page

vers le début d'exercise 2


Partie 2

Documents utilisés

Trésor de la Langue Française Informatisé

Mots utilisés

Arborescence XML

Représentation Structurée des Entrées

Fichier XML avec entrées (clic droit pour télécharger)

Vérification de Structure Valide

Fichier DTD (clic droit pour télécharger)

vers le haut de la page

vers le début de partie 2