Etape 3 : Récupération des textes bruts avec LYNX

Lynx est un navigateur Internet qui a la particularité de fonctionner en mode texte brut.

Pour créer la troisième colonne du tableau, nous avons utilisé cette commande.
L'opération consiste à extraire le texte brut des pages aspirées et à le stocker dans le répertoire "DUMP".
La commande lynx avec l'option -dump convertit les pages en langage HTML en pages textes.




















Description des commandes

  • WGET
  • LYNX
  • EGREP