#!/bin/bash
### Il faut se placer initialement dans le répertoire /PROGRAMMES ###
echo "Pour analyser des fichiers dans un répertoire, saisir un chemin S.V.P: ";
read dossier;
echo "Répertoire lu et donne le chemin où tu veux créer la page :";
read tablo;
echo "Tableau créé";
read langue ;
echo "Langue lue";
read motif ;
echo "Motif lu";
echo "
Tableau des liens" > $tablo ;
echo "
Tableau des liens
" >> $tablo ;
i=1;
for fichier in `ls $dossier`
{
y=1;
echo "
Fichier $fichier |
PAGES-ASPIREES |
DUMP TEXT |
CONTEXTE.txt |
CONTEXTE.html |
" >> $tablo ;
mkdir ../PAGES-ASPIREES/$langue/ ;
mkdir ../DUMP-TEXT/$langue/ ;
mkdir ../CONTEXTES/$langue/ ;
mkdir ../CONTEXTES/$langue/html/ ;
for nom in `cat $dossier/$fichier`
{
wget -O ../PAGES-ASPIREES/$langue/$i.html $nom ;
lynx -dump -nolist $nom > ../DUMP-TEXT/$langue/$i.txt ;
### Spécifier les options -A 1 pour avoir une ligne de texte après le motif ; -B 1 pour avoir une ligne avant ; + spécifier le fichier de sortie pour l'egrep => Contexte$i.txt
egrep -i -A 1 -B 1 "$motif" ../DUMP-TEXT/$langue/$i.txt > ../CONTEXTES/$langue/CONTEXTE$i.txt ;
sed -e "s/$motif/$motif<\/FONT>/ig" ../CONTEXTES/$langue/CONTEXTE$i.txt > ../CONTEXTES/$langue/html/html$i.html ;
sed -e "s/$/<\/br>/" ../CONTEXTES/$langue/html/html$i.html > ../CONTEXTES/$langue/html/toto$i.html ;
### Pour que le cat fonctionne, il faut qu'il y ait un fichier titre.html (qui contient juste ) et un fichier titi.html (qui contient ) dans ton répertoire /PROGRAMMES
cat titre.html ../CONTEXTES/$langue/html/toto$i.html titi.html > ../CONTEXTES/$langue/html/contextehtml$i.html
echo "
URL $y |
Page Aspiree |
Texte Dump |
texte brut |
Contexte |
" >> $tablo;
rm ../CONTEXTES/$langue/html/html$i.html ;
rm ../CONTEXTES/$langue/html/toto$i.html ;
let "i+=1" ;
let "y+=1" ;
}
}
echo "
" >> $tablo ;