Devoir n°2

 

 

I. Préambule

 

Le fichier  de travail duchn.xml est un fichier balisé qui se présente sous la forme suivante:

<w><forme>la</forme><lemme>le</lemme><categorie>DETDFS</categorie></w>

 

Cependant, pour la suite de notre travail, nous allons modifier ce fichier afin de ne garder que la forme et la catégorie des mots, ce qui nous donnera un fichier qui aura l'allure suivante:

la_DETDFS

petite_ADJMS

...

L'image “file:///C:/TAL/Devoir1/5.jpg” ne peut être affichée, car elle contient des erreurs.

Pour effectuer cette modification, nous allons créer une macro sous Xemacs.

 

Pour réaliser cette transformation, nous allons procéder par étapes:

 

      1ère étape: on supprime <w><forme> que l'on remplace par un espace.

Voir résultat

 

      2ème étape: on remplace </forme><lemme>lelemme</lemme><categorie> par " _ "

Voir résultat

 

      3ème étape: on remplace</categorie></w> par un espace.

Voir résultat

 

 

Détail de la macro:

 

 

 

L'image “file:///C:/TAL/Devoir1/Deduktion-und-Unterhaltung-1.jpg” ne peut être affichée, car elle contient des erreurs.

C-x(

Pour commencer la macro

M-x replace-regexp

Pour trouver notre expression régulière et la remplacer.

Expression régulière

1ère étape: <w><forme>

2ème étape:</forme><lemme>.+</lemme><categorie>

3ème étape:</categorie></w>

Entrer

Pour passer à l'étape suivante, à savoir dire par quoi on veut remplacer l'expression régulière.

On dit par quoi on remplace

1ère étape: espace

2ème étape: " _ "

3ème étape: espace

C-x)

Pour finir la macro.

 

Lorsque nous demandons le détail de la macro sous Xemacs, ça se présente sous cette forme :

 

Macro:

 

M-x                              ;; execute-extended-command

repl                               ;; self-insert-command * 4

TAB                              ;; indent-for-tab-command

reg                                ;; self-insert-command * 3

TAB                              ;; indent-for-tab-command

RET                              ;; newline

<w> <forme>                ;; self-insert-command * 10

RET                              ;; newline

SPC                              ;; self-insert-command

RET                              ;; newline