Valeur                      

                                                                                                                                                                                                                                                                                                                                      Accueil       Etapes      Commandes      Script      Tableaux      Commentaire                                                                                                                                                                                                                       

                                                                                         
                                   
                       Script

           
voici le dernier script


#!usr/bin/bash  

mkdir pagesaspirees;  #création de répertoire avec la commande "mkdir".
mkdir contexte
mkdir dump
echo "Pouvez-vous indiquer le dossier où se trouvent les fichiers d'URL? ";
read repertoireURL ; # permet d'enregistrer la variable repertoireURL
echo "Quel nom veux-tu donner a ton tableau ?"; #c'est le tableau de liens à créer
read tablo; #enregistre nom donné par utilisateur dans la variable $tablo
echo "Donne le motif recherchésur les pages originales : ";
read motif;
read motif1;  # deux motifs donnés par utilisateur dans les  variables $motif et $motif1

for dossier in `ls $repertoireURL`

    do
    mkdir pagesaspirees/$dossier;  #création de dossier dans le répertoire
    mkdir dump/$dossier
    mkdir contexte/$dossier
    echo "<html><head><title>Valeur</title></head><body>">>$tablo;  #début du document html
    echo "<table width=60% border = "4" bordercolor = "#330000">">>$tablo;
    echo "<p><TR><TD bgcolor=\"#996666\" colspan=10 align=center><STRONG><FONT SIZE=6><FONT COLOR= "#660000">Sens  $dossier</FONT></STRONG></TD></TR>">>$tablo;
    for fichier in `ls $repertoireURL/$dossier`
          {
             cpt=1
              {
                 if echo "$ligne" | egrep -i "^h"
                        then                     
                             let " cpt += 1"
                
                  fi
               }
                  
              nfichier=`basename $fichier .txt`
        echo "<TR><TD bgcolor=\"#CC9999\"colspan=4 rowspan=$cpt align=left><FONT SIZE=5><FONT COLOR=\"#993333\">$nfichier</FONT></TD></TR><TR>">>$tablo;
   
        mkdir pagesaspirees/$dossier/$nfichier   #création des fichiers dans chaques dossiers
        mkdir dump/$dossier/$nfichier
        mkdir contexte/$dossier/$nfichier
        compt=0
            for ligne in `cat $repertoireURL/$dossier/$fichier`
            {
                        if echo "$ligne" | egrep -i "^h"  #lire tous les urls dans les fichiers textes.
                               then                    
                                                let "compt += 1"
               
                              
                        echo "<tr><TD width=10% ><a href="$ligne">URL $compt</a></TD>">>$tablo
                        wget -t 2 $ligne -O pagesaspirees/$dossier/$nfichier/URL_$compt.html # URL numeroté dans chaques dossiers séparés par les langues.
                        echo   "<TD width=10%>            <a href="./pagesaspirees/$dossier/$nfichier/URL_$compt.html">PAGE_$compt</a></TD>" >> $tablo;
 # les pages HTML aspiirées par wget
                        lynx -dump ./pagesaspirees/$dossier/$nfichier/URL_$compt.html >                      ./dump/$dossier/$nfichier/dump_$compt.txt             
                        echo "<TD width=10%><a href="./dump/$dossier/$nfichier/dump_$compt.txt ">DUMP_$compt</a></TD>" >> $tablo;  
                           #
les fichier .txt avec le texte dumpé par lynx
                   
                          # si le fichier d'url traité est francais.txt alors   
                        if [ $fichier == "francais.txt" ]
                        then
                                          
                          egrep -i "\b$motif|$motif1\b" ./dump/$dossier/$nfichier/dump_$compt.txt >./contexte/$dossier/$nfichier/contexte_$compt.html
                       
                                            fi
                       
                        # si le fichier d'url traité est japonais.txt alors                       
                       if [$fichier == "japonais.txt"]
                        then
                        perl ./programmes/mini-grep-multilingue.pl "UTF-8" ./dump/$dossier/$nfichier/dump_$compt.txt ./programmes/motifjaponais.txt
                        cp ./resultat-extraction.html  ./contexte/$dossier/$nfichier/contexte_$compt.html
                                           fi
                       
                        # si le fichier d'url traité est russe.txt alors   
                       if [$fichier == "russe.txt"]
                        then           
                        perl ./programmes/mini-grep-multilingue.pl "UTF-8" ./dump/$dossier/$nfichier/dump_$compt.txt ./programmes/motifrusse.txt
                        cp ./resultat-extraction.html ./contexte/$dossier/$nfichier/contexte_$compt.html
                       fi                
                       

                        #résultat des contextes affichés
                        echo "<TD width=10%><a href="./contexte/$dossier/$nfichier/contexte_$compt.html">CONTEXTE_$compt</a></TD></tr>" >> $tablo;
                                                
                            fi   
        
               }
        }
    echo "</table></body></html><p>" >> $tablo ; #fin du document html
done