Résultat

Pour terminer ce mini-projet nous avons réalisé un tableau recapitulatif qui contient les liens vers les pages sur internet, les pages aspirées au format html (wget), les pages aspirées au format texte (lynx) et les fichiers contenant uniquement les occurrences du mot barrage, dans un contexte de quelques lignes autour de l'occurrence.

Nous sommes progressivement arrivées à l'écriture d'un script complet, qui prend en charge tout le processus, depuis la récupération des fichiers listant les urls, à la création de fichiers contenant seulement les phrases présentant au moins une occurrence du mot 'barrage', en passant par la création de l'arborescence nécessaire à une bonne organisation de l'ensemble, la rapatriation des pages avec wget, et leur traitement par les commandes lynx et egrep.

Cliquer ici  Pour consulter le "tableau syntétique".