Etape N°3 :

    Extraire des pages Html aspirées, le texte qu’elles contiennent. A l’aide de la commande

Lynx –dump qu’on a utilise dans un petit script appliqué sur les pages html aspirées (automatisation de la tache).

 

Script utilise:

 

Resultats:

 

 

    Apres ca on  a appliquer sur les textes récupérés la commande EGREP avec l’option –i pour but d’extraire les phrases contenant le mot « barrage »

 

Script utilise:

 

Résultats: