Préliminaires

Présuppositions

  1. Les fichiers à traiter sont dans le dossier "."
  2. ESPACE
    veut dire "taper un espace"
  3. RETOUR-CHARIOT
    veut dire "taper retour-chariot"
  4. Chaque début de ligne implique un retour-chariot

Suppression de toutes les balises

lancer emacs
emacs
ouvrir le fichier duchn.xml
C-x C-f duchn.xml
recherche d'expressions régulières
M-x query-replace-regexp
un motif pour les balises
<[^<]*>
remplacer par 1 espace (lisibilité)
ESPACE
tout remplacer
!
quitter emacs
C-x C-c

Recoder le texte en tant que la_le_DETDFS

lancer emacs
emacs
ouvrir le fichier duchn.xml
C-x C-f duchn.xml
recherche d'expressions régulières
M-x query-replace-regexp
motif...
<w><forme>
remplacer par ""
RETOUR-CHARIOT
tout remplacer
!
aller au début du buffer
M-<
recherche d'expressions régulières
M-x query-replace-regexp
motif...
</forme><lemme>
remplacer par "_"
_
tout remplacer
!
aller au début du buffer
M-<
recherche d'expressions régulières
M-x query-replace-regexp
motif..
</lemme><categorie>
remplacer par "_"
_
tout remplacer
!
aller au début du buffer
M-<
recherche d'expressions régulières
M-x query-replace-regexp
motif
</categorie></w>
remplacer par " "
ESPACE
tout remplacer
!
aller au début du buffer
M-<
M-x query-replace-regexp
(un motif pour <?xml ...?>) remplacer par ""
<\?[^<]*\?>

RETOUR-CHARIOT
tout remplacer
!
aller au début du fichier
M-<
recherche d'expressions régulières
M-x query-replace-regexp
(un motif pour enlever les balises cordial2xml)
<\/?cordial2xml>
remplacer par ""
RETOUR-CHARIOT
tout remplacer
!
aller au début du buffer
M-<
enregistrer sous..
C-x C-w
duchn_p2.xml
quitter emacs
C-x C-c