PARTIE 1 : EXERCICE 1:

Question 1:

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche les lignes contenant les mots commançants par "citoy". Donc on utilise l'exepression régulière "\b" qui signifie "qui commence ou finit par...".

Question 2:

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche les lignes contenant les mots commançants par "aristo". Donc on utilise l'exepression régulière "\b" qui signifie "qui commence ou finit par...".

Question 3:

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche les lignes contenant les mots commançants par "bougre". Donc on utilise l'exepression régulière "\b" qui signifie "qui commence ou finit par...".

Question 4:

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche les lignes qui parlent de "Sans-culottes". Or sachant que, dans ce texte, les mots contenants "culottes" sont les mots "Sans-culottes", on peut donc juste chercher les mots contenant l'expression "culotte".

Question 5:

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche les lignes contenant les mots ayant une majuscule. Or dans ce texte, on peut observer que tous les mots ayant une majuscule sont mis en évidence par "*" mis devant ces mêmes mots. Donc dans la commande, on va inhiber le statut d'opération de "*" avec "\" afin de trouver les mots ayant une "*".

Question 6:

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche les lignes contenant les mots finissants par "er". On va donc utiliser l'expression regulière "\b" qui signifie "qui commence ou finit par..." après "er".

Question 7:

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche les lignes contenant les mots qui parlent de "danger". On va donc chercher les mots commançant par "dang" à l'aide de l'expression régulière "\b".

Question 8:

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche les lignes contenant les mots qui parlent de "patrie". On va donc chercher les mots commançant par "patri" à l'aide de l'expression régulière "\b" mais commençant aussi par une lettre de l'ensemble "a".

Question 9:

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche les lignes contenant les mots qui parlent de "liberté". On va donc chercher les mots commançant par "lib" à l'aide de l'expression régulière "\b" mais pouvant aussi se terminer par une lettre de l'ensemble "re".

Question 10:

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche les lignes contenant les mots qui parlent de "temps". Donc on cherche dans le contexte suivant: on veut un mot commençant par "temp" est étant éventuellement suivit d'une lettre de ensemble de caractère "s". De plus, on peut observer que le mot "temps" dans le texte est employé comme ayant la même sigification que "tant" et que "temps" lui-même.

Question 11:

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche les lignes contenant les mots qui parlent de "république". On va donc chercher les mots commançant par "républi" à l'aide de l'expression régulière "\b" or "é" n'existe pas dans le répertoire de commande on va donc remplacer "é" par "." qui signifie "n'importe quel caractère".

Question 12:

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche les lignes contenant les mots qui parlent de "trahison". On va donc chercher les mots commançant par "trahi" à l'aide de l'expression régulière "\b".

Question 13:

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche des lignes contenant des séquences de mots comportant une forme négative "ne...pas, n’...pas, ....". On va donc chercher les mots commançant par "n" à l'aide de l'expression régulière "\b" puis suivit soit de la lettre "e" ou de "'", suivit de n'importe quel caractère: "." de 0 à l'infini:"*" et suivit de "pas".

PARTIE 1: EXERCICE 2:

Question 1:

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

On chercher à compter le nombre de mot dans le fichier "dico.txt", pour ce faire, on utilise les commandes "wc" et "-w" qui permettent de compter le nombre de mot dans un fichier. De plus, on envoie le résultat dans fichier nommé "ex1-part2-q1".

Question 2:

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche à extraire des mots du texte se terminant par "able" en ajoutant à quel ligne le mot apparaît, ainsi on utilise la commande "-n" pour savoir à quelle ligne apparaît le mot et on utilise la commande "able\b" pour extraire tous les mots se finissant en "able".

Question 3:

Première commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche les tous les mots du fichier "dico.txt" se finissant par "able", ainsi on utilise la commande "able\b" pour extraire tous les mots se finissant en "able " et on envoie les résultats dans un fichier nommé "motq3.txt" .

Deuxième commande tapée avec egrep

Résultat de la commande

Justification de la commande

On compte la nombre de mot se trouvant dans le fichier "motsq3.txt" à l'aide des commandes "wc" et "-w" et on envoie les résultats dans un fichier nommé "ex1-part2-q3.txt".

Troisième commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche à donner la catégorie des mots contenus dans le fichier "motq3" à l'aide de la commande "able_" et on envoie les résultats dans un fichier nommé "motscatégorie.txt" .

Question 4:

Première commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche les tous les mots du fichier "dico.txt" se finissant par "eux", ainsi on utilise la commande "eux\b" pour extraire tous les mots se finissant en "eux " et on envoie les résultats dans un fichier nommé "motq4.txt" .

Deuxième commande tapée avec egrep

Résultat de la commande

Justification de la commande

On compte la nombre de mot se trouvant dans le fichier "motq4.txt" à l'aide des commandes "wc" et "-w" et on envoie les résultats dans un fichier nommé "ex1-part2-q4.txt".

Troisième commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche à donner la catégorie des mots contenus dans le fichier "motsq4" à l'aide de la commande "eux_" et on envoie les résultats dans un fichier nommé "motscatégories4.txt" .

Question 5:

Commande tapée avec egrep

Résultat de la commande

Justification de la commande

On cherche à extraire les mots finissant soit par "able" soit par "ible", ainsi on utilise la commande "[a:i]ble\b".

PARTIE 2:

Document structurer:

Présentation de l'arbre XML:

Présentation sous forme de balise

Validation de la grammaire de l'arbre XML:

Justification:

On a une entrée (Soit un mot, ici un nom de fromage) qui est structurée à partir de trois axes (La « morphosyntaxe », la « définition » et les « normes linguistiques ») eux même divisés en différents axes, axes qui ne sont pas tous présents selon les définitions (les axes qui ne sont pas nécessairement présents sont indiqués entre parenthèses).

Dans une entrée indiquant un nom de fromage, on retrouvera toujours l’axe « morpho-syntaxique » lui-même constitué des axes « catégorie » et « genre » qui regroupe du texte.

Dans cette entrée, on retrouvera aussi toujours l’axe « définition » qui à soit une seule « acception » ou plusieurs et quelques fois des « règles d’usage », l’acception est constituée d’une ou de plusieurs citations tandis que les « règles d’usage » sont généralement constituées de puce et de remarque.

L’autre axe de l’entrée est l’axe des « normes linguistiques » lui-même composé des axes « prononciation et orthographe » qui n’est pas toujours présent, « étymologie et histoire », « fréquence » et l’axe « bdg » qui ne sont pas toujours présents. L’axe « prononciation et orthographe » contient deux autres axes qui ne sont pas toujours présents non plus, l’axe « prononciation » et l’axe « orthographe ». De plus tous les axes contiennent du texte.

Ainsi voici dix exemples de structure de définition de nom de fromage sous forme de balises.