Trameur



L'étiquetage morpho-syntaxique d'un texte est souvent l'une des premières étapes en traitement automatique des langues (TAL). Il consiste à identifier, pour chaque mot, sa classe morpho-syntaxique (catégorie grammaticale, genre, nombre, temps...) à partir de son contexte.


Le trameur est un outil informatique qui permet de construire des opérations lexicométriques/textométriques à partir d'un corpus.
La lemmatisation désigne l'analyse lexicale consistant à retrouver la forme canonique d'un mot fléchie appelée le lemme.
L'objectif de la textométrie est de compter des éléments (contenus textuels) dans des ensembles (contenants) permettant ainsi d'effectuer une indexation linguistique automatique.

Le trameur intègre le programme "TreeTagger" qui est un système d'étiquetage automatique des catégories grammaticales des mots avec lemmatisation sous forme de graphes.