Secteur TAL Informatique,
Université Sorbonne nouvelle, Paris 3

19 rue des Bernardins, 75005 Paris
Secteur TAL Informatique, Université Sorbonne nouvelle, Paris 3

Slides Formats de documents électroniques

Cliquez ici pour démarrer


Table des matières

Formats de documents électroniques

Sommaire

Partie 1

Architectures pour les documents électroniques

Diapositive PPT

Formats de documents (1)

Formats de documents (2)

Comment décrire un document ?

Quelques systèmes pour l’édition de documents électroniques

Microsoft Word

Diapositive PPT

PDF : Portable Document Format (1)

PDF : Portable Document Format (2)

Lecture de document PDF avec Acrobat Reader (Adobe)

Le langage LATEX

Diapositive PPT

HyperText Markup Language (1)

Diapositive PPT

HyperText Markup Language (2)

SGML : Standart Generalized Markup Language

Documents SGML

Diapositive PPT

Diapositive PPT

Diapositive PPT

Diapositive PPT

Diapositive PPT

Pourquoi SGML

SGML, présentation (1)

SGML, présentation (2)

Brève histoire de la norme

Qui utilise SGML

Vers un nouveau paradigme Internet ?

Historique des langages balisés

HTML : balises prédéfinies

HTML : limites formelles

Les styles : le futur de HTML ?

Une nouvelle norme

XML, une version simplifiée de SGML

Partie 2

« Fragilité » des données textuelles

Interpréter les documents

Présentation/Représentation logique (1)

Présentation/Représentation logique (2)

Présentation/Représentation logique (3)

Remarques préliminaires

On ne balise pas à la main

Une normalisation des documents : pourquoi faire ?

Applications autour du document électronique (1)

Applications autour du document électronique (2)

Description formelle de document ou de données textuelles (1)

Diapositive PPT

Représentation formelle d’un mémo

Description formelle de document ou de données textuelles (2)

Représentation formelle d’un courrier électronique

Description formelle de document ou de données textuelles : entrée de dictionnaire

Informatisation de dictionnaire

Principes retenus : DTD TEI

Balisage semi-automatique

Exemple d’entrée : l'article dague

Définir les atomes de description d’une entrée

Diapositive PPT

Description des champs de l ’entrée

Diapositive PPT

Structure de l’article

Structure d’une entrée balisée : l’article DAGUET

De la grammaires pour linguistes...

… aux grammaires de textes

Différents types de balisage

Documents structurés

Balisage logique généralisé

Mais que fait Word (Microsoft) ?

Partie 3

Des documents à la représentation formelle des documents

Pré-requis pour les documents électroniques

SGML : grammaire (DTD) et documents

Exemple de DTD (1) (grammaire)

Une instance de document de type « roman »

Diapositive PPT

Une instance de document de type « bulletin météorologique » éditée via un éditeur idoine

SGML : Définitions (1)

Philosophie de SGML

SGML : Définitions (2)

SGML : Définitions (3)

DTD Définition de Type du Document (1)

DTD Définition de Type du Document (2)

A quoi sert la DTD ? (1)

A quoi sert une DTD (2)

Balisage

Baliser = Interpréter

On balise un texte en deux temps

Structure d’une DTD (1)

Structure d’une DTD (2)

Commentaire

Diapositive PPT

Eléments (2)

Omettre des balises

Eléments (3)

Eléments (4)

Eléments (5)

Eléments (6)

Attributs (1)

Attributs (2)

Attributs (3)

Diapositive PPT

Entités (2)

Entités (3)

Exemple de DTD (1)

Exemple de DTD (2)

Exemple de DTD (3)

Exemple de DTD (4)

Un exemple de mémo conforme à cette DTD 

Exemple de DTD (4)

Un exemple de mémo conforme à cette DTD

Quelques outils SGML

Diapositive PPT

Diapositive PPT

Autres normes autour de SGML

TEI (Text Encoding Initiative)

Partie 4

Architecture de chaîne documentaire

Normalisation d ’un corpus de textes

Exemples d ’applications

Corpus Encoding Standart (1)

Corpus Encoding Standart (2)

Corpus Encoding Standart (3)

Codage TEI des dictionnaires

Composants de base

Du dictionnaire à la DTD

Organiser la structure d ’une entrée

Diapositive PPT

Problèmes et difficultés (1)

Problèmes et difficultés (2)

Des entrées d'un dictionnaire à une DTD (1)

Des entrées d'un dictionnaire à une DTD (2)

DTD pour dictionnaire

Auteur:Serge Fleury