Glossaire

Wget

Le manuel Cygwin décrit la fonction wget comme "a noninteractive network retriever" donc un utilitaire noninteractif qui permet de récupérer des pages web en les sauvegardant en local. Il permet de créer de versions locales des sites en recréant leur arborescence(opération qui est aussi connue sous le nom de téléchargement récursif).
Parmi les options les plus courantes de wget, deux nous intéressent particulièrement:
-une option d'entrée (input file option) wget -i qui permet de lire les URL d'un fichier qu'on lui donne en entrée.
-une option de sortie(output file option) wget -O qui permet de concaténer et écrire les résultats en fichier.

Lynx -Dump


L'option Dump de la commande lynx permet d'afficher en sortie le texte d'un URL indiqué en ligne de commande. Suivie du nom d'un fichier, elle écrit le contenu text du site dans le fichier de sortie.
Syntaxe:
lynx -dump "http//.."> filename

Grep


C'est une commande qui permet de chercher dans un fichier indiqué en ligne de commande, les lignes contenant un motif ou un pattern. L'option -i indique que le motif doit être récupéré sans faire attention à la casse. Les options A et B suivis d'un numéro indiquent le nombre de lignes retenues comme contexte antérieur ou postérieur du motif.
Syntaxe:
grep -A2 -B2[ pattern][file name]