#!/bin/bash echo "Donner le nom de repertoire contenant les fichiers html:"; read rep; # `cd $rep`; ## Débarasser les fichiers des balises html for nom in `ls $rep/*.html` { `lynx -nolist -dump $nom > $nom.txt`; } ## Raffiner les fichiers en enlévant des 'restes' d'images comme "[toto.gif]" for nom1 in `ls $rep/*.txt` { `sed -e 's/\[[A-Za-z][A-Za-z]*.gif\]//g' $nom1 > $nom1.raf`; } # \[ : pour déspecialiser le caractère "[" # \] ---"--- # [...][...] : pour remplacer des chaînes avec plusiers occurences de ...