Le script

#!/bin/bash

#si le # est enlevé, les variables sont initialisées en dur et non par l'utilisateur
#sortie="tableauxLiens.html";
fichlog="log.txt";
pagesasp="pagesAsp";
pagesdump="pagesDump";
#dossier="o:/lurl";
#projet="projet";

# mettre des # si on les enlève audessus
echo "donnez le nom complet du dossier contenant les fichiers avec les liens http";
read dossier;

echo "donnez un nom de dossier pour le projet";
read projet;


mkdir $projet;
cd $projet;
mkdir $pagesasp;
mkdir $pagesdump;

#création page html et titre
echo "<html><head>  <meta content=\"text/html; charset=ISO-8859-1\" http-equiv=\"content-type\"><title>tableaux de liens</title></head><body style=\"background-color: rgb(255, 204, 153); color: rgb(0, 0, 0);\"
 alink=\"#ee0000\" link=\"#0000ee\" vlink=\"#551a8b\">
<h1 style=\"color: rgb(255, 0, 0); text-align: center;\"><br><br>Tableau présentant les différents sens du mot <i>barrage</i> dans leur contexte<h1>" > $sortie; #création page html

cerreur=0; #compte les urls non-wgettables
for fichier in `ls $dossier` #pour chaque fichier du dossier en entrée
{
    titre=$(echo $fichier | cut -d '.' -f1); #enlève l'extension au nom de fichier pour le titre
    #titre du tableau et début de tableau
    echo "<h2 style=\"color: rgb(102, 0, 204)\" align=\"center\">$titre</h2><table border=1>" >> $sortie;
    asp=$pagesasp/$titre;
    dmp=$pagesdump/$titre;
    mkdir $asp;
    mkdir $dmp;

    i=0;
    for lien in `cat $dossier/$fichier` #pour chaque lien
    {
        echo "-"; # pour voir évolution
        nom=$titre$i;
        #aspire la page
        wget $lien -E -nv -a $fichlog -O $asp/$nom".html";
        if test -s $asp/$nom".html" # si la page a été aspirée
        then
        #dump la page
        lynx -dump -nolist $asp/$nom".html" > $dmp/$nom".txt";
        #cherche les lignes avec barrage
        contexte=$(egrep -i "barrage" $dmp/$nom.txt);
        #crée ligne du tableau
        echo "<tr>" >> $sortie;
        echo "<td><A href=\"$asp/$nom.html\">$lien</td>" >> $sortie;
        echo "<td><A href=\"$dmp/$nom.txt\">texte</td>" >> $sortie;
        echo "<td>$contexte</td>" >> $sortie;
        echo "</tr>" >> $sortie;     
        let "i+=1";
        else # sinon rapport d'erreur
        let "cerreur+=1";
        echo "-----echec sur $lien" >> $fichlog;
        fi
    }
    # ferme un le tableau d'un sens
    echo "</table>" >> $sortie;
    echo "<br>" >> $sortie;
}

echo "<br><p>Il ya $cerreur url(s) invalide(s).<p></body></html>" >> $sortie;


                                voir l'algorithme                                                             exécuter le script