Secteur TAL Informatique,
Université Sorbonne nouvelle, Paris 3

19 rue des Bernardins, 75005 Paris
Secteur TAL Informatique, Université Sorbonne nouvelle, Paris 3

Sommaire

Les expressions régulières
Programmation
Format de données textuelles
Le Web

Une partie des textes présentés ici ont été rédigés à partir des ouvrages suivants :
Habert Benoît, Cécile Fabre, Fabrice Issac, De l'écrit au numérique (constituer, normaliser et exploiter les corpus électroniques), InterEditions, 1998.
Michèle Soria, Anne Brygoo, Michelle Morcrette, Odile Paliès, Initiation à la programmation par Word et Excel, International Thomson Publishing, 1998.
Jean Baudot, Introduction aux grammaires formelles, SODICIS Editeur, Montréal, 1987.
Pierrette Bouillon, Traitement automatique des langues naturelles, Editions Duculot, 1998.

OS (Linux vs Windows)

Les expressions régulières

Les expressions régulières : Une introduction

Les expressions régulières : Préambule

Expressions Régulières (liens externes)

Liens autour d'EMACS

Programmation

Formats de données textuelles

XML

HTML

SGML, DTD, TEI...

  • Présentation de la TEI "La TEI simplifiée : une introduction au codage des textes électroniques en vue de leur échange", par Lou Bernard, Oxford University. Ce document est une traduction d'un document paru dans le cahier GUTemberg.
  • Pour télécharger des documents écrits dans la rue GUTemberg, se connecter sur le site de cette revue : on y trouvera nombre d'articles : lien vers cahier GUTemberg. Les publications au format PostScript sont disponibles derrière le lien suivant : Publications PS du cahier GUTemberg.
  • "Introduction pratique à SGML" par Michel Goossens. Ce document au format postscript est paru dans le cahier GUTemberg n°19 Janvier 1995. Pour lire ce document, il convient tout d'abord de le télécharger, puis de disposer d'un logiciel capable de lire ce type de fichier (par exemple GhostScript)

Le Web et Internet