Script commenté


#!/bin/bash
echo "Donnez le nom du fichier (html) ou le tableau sera créé:";
Le texte entre les " " s'affiche sur l'écran et demande à l'utilisateur d'interagir
read tablo;
Récupération du nom de fichier entré par l'utilisateur dans une variable nommée tablo
echo "<html><head><title>TableauURL</title></head><body>" > $tablo;
Création du fichier html dans ce variable
echo "<table left border="1">" >> $tablo;
Création du tableau dans ce fichier
echo "Donnez le nom du répertoire où sont les URLs";
Le texte entre les " " s'affiche sur l'écran et demande à l'utilisateur d'interagir
read rep;
Récupération du nom du fichier dans une variable nommée rep
cd $rep;
Déplacement dans le répertoire


for fic in `ls `  Une boucle qui affiche tous les éléments du répertoire courant (=des fichiers contenant des URLs dans notre cas) et execute les instructions suivantes pour tous les éléments
{
    mkdir ../Pages/$fic;
    Création d'un sous-répertoire (dans le répertoire Pages) portant le même nom que le fichier en question
    mkdir ../Dump-texte/$fic;
   
Création d'un sous-répertoire (dans le répertoire Dump-texte) portant le même nom que le fichier en question
    mkdir ../Egrep-texte/$fic;
    Création d'un sous-répertoire (dans le répertoire Egrep-texte) portant le même nom que le fichier en question
    echo "<tr align="center">" >> ../$tablo;
    Création de la première ligne du tableau avec alignement au centre
    echo "<td bgcolor="#CCFFFF" colspan="4" rowspan="1"><big>Usage: $fic</big></td></tr>" >> ../$tablo;
    Mise en forme de la première ligne

        for url in `cat $fic`  Une boucle qui affiche tous les lignes du fichier courant et execute les instructions suivantes pour tous les éléments
        {
        wget $url -O ../Pages/$fic/$(basename ${url}).html;
        Récupération (avec wget) de la page web se trouvant à l'adresse indiquée dans le fichier
        echo "<tr><td><a href=$url>$url</a></td>" >> ../$tablo;
        Création de la premier cellule d'une ligne consacrée à cette URL en lui associant un lien vers ce URL 
        echo "<td><a href=Pages/$fic/$(basename ${url})>$(basename ${url})</a></td>" >> ../$tablo;
        Création de la deuxième cellule d'une ligne consacrée à cette URL en lui associant un lien vers la page enregistrée 
        lynx -dump $url > ../Dump-texte/$fic/$(basename ${url}).txt;
        Récupération (avec lynx) du texte de la page web
        echo "<td><a href=Dump-texte/$fic/$(basename ${url}).txt>$(basename ${url}).txt</a></td>" >> ../$tablo;
        Création de la troisième cellule d'une ligne consacrée à cette URL en lui associant un lien vers le fichier texte créé 
        egrep -i -n -B1 -A1 barrage ../Dump-texte/$fic/$(basename ${url}).txt | egrep -v http:// > ../Egrep-texte/$fic/$(basename ${url})egrep.txt;
        Filtrage (avec egrep) des lignes contenant du mot "barrage" 
        echo "<td><a href=Egrep-texte/$fic/$(basename ${url})egrep.txt>$(basename ${url})egrep.txt</a></td></tr>" >> ../$tablo;
        Création de la quatrième cellule d'une ligne consacrée à cette URL en lui associant un lien vers le fichier contenant les lignes filtrées
        }
}
echo "</table></body></html>" >> ../$tablo;
Déclaration de la fin du fichier html