Préambule

On va reprendre le fichier duchn-p2.xml du devoir 1. On transformera ce fichier-ci pour qu'il n'affiche que des lignes de la forme suivante : la_DETDFS
cat corpus/duchn.xml |
sed -e "s/<w>/\n<w>/g" |
egrep -e "<w>" |
sed -e "s/<w><forme>//g" |
sed -e "s/<\/forme><lemme>.*<\/lemme><categorie>/_/g" |
sed -e "s/<.*//g" >
corpus/duchn-2.txt