Bienvenue !

Ce petit site présente certains programmes abordés en cours d'informatique et industries de la langue, en L3I02 cours de seconde année de licence en sciences du langage, à l'ILPGA. 

La première partie concerne le programme Python, par le biais de son émulateur Cygwin. On verra comment récuperer le contenu d'une page web, la nettoyer de tout contenu non linguistique. 

Quelques exercices appliqués au texte "Le père Duschene" sont présentés, relatifs aux commandes qui permettent de filter certaines lignes du texte. 

La seconde partie concerne la modélisation en XML . 

Elle comporte différents travaux, appliqués au "Trésor de la Langue Francaise", tels qu'une arborescence qui décrit les données sélectionnées, une utilisation du balisage XML pour élaborer une représentation structurée de ces meme données, et la présentation de la DTD du fichier XML complet.