bienvenue à vous sur ce

site de la vie des mots sur le web

Notre site de la vie des mots sur le web a été crée dans le but de répondre aux exigences de l'examen du premier semestre de Master PluriTAL de l'Université Paris 3.

Le bon mot

Le but de ce projet est de réaliser un script prenant en entrée une liste d’URLs contenues dans un fichier texte et dont les pages web contiennent un mot-clé. Ce script rend en sortie une page au format HTML, contenant un tableau, qui lui-même contient des liens vers :

- chaque page listée

- une copie locale de chaque page

- une version texte brut de chaque page

ET surtout, une ligne de concordance, c’est à dire le mot choisi dans son contexte.

Le mot choisi pour ce projet est le mot "char"

Les scripts et les résultats se trouvent dans les sections correspondantes de Bash ou de Perl, en fonction du langage de programmation souhaité.