Formation CORLI. 25 octobre 2017

Explorer un corpus annoté avec iTrameur / le Trameur


Présentation

(version PDF)


iTrameur

iTrameur : Application utilisable dans votre navigateur habituel et reproduisant des calculs disponibles dans Le Trameur : http://www.tal.univ-paris3.fr/trameur/iTrameur.

Autres extensions du Trameur sur le Web :


Corpus "démos"

Les corpus utilisés pour démos sont accessibles dans l'onglet "Aide" du logiciel en ligne.



Le Trameur

Documentation : format PDF, format HTML

Ci-dessous, la documentation complète du Trameur disponible en ligne via issuu :


Téléchargement :

 Le Trameur, exécutable sous Windows setup-trameur-12.exe

 Le Trameur (64b), exécutable sous Windows setup-trameur-12-x64.exe

 Le Trameur, version MacOsX letrameur-osX.


Formats : les formats de fichier pour créer une nouvelle base textométrique avec Le Trameur

Les formats de fichier suivants sont présentés dans la documentation en ligne. Illustration sur Le Dormeur du Val et Ulysse (2 volets : EN, FR)
[DORMEUR] - Format texte brut. Format texte brut avec marquage de sections (dans les 2 cas, pas de Cadre).
[DORMEUR] - Format texte brut : balisage à la Lexico. Format texte brut : balisage à la Lexico (étendu).
[DORMEUR] - Format texte XML. Format XML/TEI.
[ULYSSE] - Corpus Aligné : avec balisage et marquage de sections alignées.
[ULYSSE] - Corpus Aligné : avec balisages XML pour les volets et les sections de l'alignement.


Corpus utilisés pour démos

(on trouvera ci-dessous les liens vers les ressources utilisées pendant l'atelier)

Corpus "brut"

Corpus Duchn

Bases textométrique (à importer)

Base Duchn. Chaque item de la Trame est associé à 5 niveaux d'annotation (forme, lemme, pos, forme, forme).

Treebank Rhapsodie : "Rhapsodie2Trameur" (v8). Chaque item de la Trame est associé à 61 niveaux d'annotation (prosodie, micro et macro-syntaxe).
SOURCES : projet Rhapsodie. Descriptif et sources des annotations

Base bilingue "Investiture Obama" (français/anglais). Cette base regroupe le discours original en anglais prononcé par B. Obama le 20 janvier 2009 à Washington, publié sur le site de The New York Times (volet EN), et 4 traductions françaises de ce discours (volets FR0-1-2-3). Les traductions ont été récupérées sur le site officiel de la Maison Blanche (volet FR0), sur les sites des journaux français Le Monde (volet FR1) et Libération (volet FR2), ainsi que sur le site de RFI (volet FR3). Les 5 volets de cette base disposent de 3 niveaux d'annotation (forme, lemme, catégorie). Cette base permet de tester les traitements spécifiques pour les bases textométriques intégrant des textes alignés (2 ou plus) (cf PDF pour cette fonctionnalité).


Lectures

[Zimina, Fleury, 2015] Zimina Maria, Fleury Serge, "Perspectives de l’architecture Trame/Cadre pour les alignements multilingues". Nouvelles perspectives en sciences sociales : revue internationale de systémique complexe et d'études relationnelles, volume 11, numéro 1, novembre 2015.
http://www.erudit.org/revue/npss/2015/v11/n1/index.html
[Résumé]

[Fleury, Zimina, 2014], Serge Fleury, Maria Zimina, Trameur: A Framework for Annotated Text Corpora Exploration, Proceedings of COLING 2014, the 25th International Conference on Computational Linguistics: System Demonstrations, August 2014, Dublin, Ireland, pages 57-61, (PDF)

[Fleury, 2013], Fleury Serge, Le Trameur. Propositions de description et d’implémentation des objets textométriques, (PDF), (texte en cours).

[Fleury, 2013-2015], Fleury Serge, Annotations Rhapsodie pour le Trameur, (PDF), (texte en cours)

[Söze-Duval, 2008], Keyser Söze-Duval. Pour une textométrie opérationnelle. (DOC)

[Salem, 2006], Salem André, Lamalle Cédric, Fleury Serge, "Vers une description formelle des traitements textométriques" (PDF), in Actes JADT 2006, Journées Internationales d'Analyse Statistiques des Données Textuelles, Besançon 2006.

[Lamalle, 2002], Lamalle Cédric, Salem André, "Types généralisés et topographie textuelle dans l'analyse quantitative des corpus textuels" (PDF), in Actes des 6èmes Journées d'analyse statistique des données textuelles, St Malo, Inria, 2002.

2017 | CLESTHIA | http://www.tal.univ-paris3.fr/trameur/ | serge.fleury[at]univ-paris3.fr