B. Habert
Projet Communautés
Cours 5
Objectif
Décrire les emplois (et éventuellement les sens) de noms
de Romanseval.
Il y a 20 noms. On commencera par ceux pour lesquels les contextes sont
les moins nombreux. Les noms seront répartis entre les membres
du projet.
Angles d'attaque
Repérer les contraintes d'emploi
Un certain nombre d'approches permettent de mettre en évidence
les micro-constructions dans lesquelles figure un mot, les attirances
qu'il entretient :
- segments répétés (Lexico) ;
- information mutuelle (couple de mots s'attirant) ;
- constructions syntaxiques privilégiées ;
- ...
Organiser les emplois
Les attirances et les micro-constructions sont structurées par
les emplois du mot. Par exemple, barrage
rentre dans la construction faire
barrage quand il s'agit d'un emploi "politique", dans tir de barrage ou match de barrage pour l'emploi
sportif, et dans franchir un barrage
pour l'emploi militaire ou policier.
Les zones denses du graphe des attirances entre mots fournissent un
repérage grossier des emplois, avec des intersections et des
limites quand le graphe est trop fourni et trop enchevêtré.
D'autres méthodes peuvent aider à organiser les emplois :
les classifications des phrases contenant le mot (avec DTM de Ludovic
Lebart par exemple).
Démarche
- Choisir un mot à décrire ;
- Examiner le résumé
de ses contextes syntaxiques principaux en lisant les informations
sur le corpus
LM10 et sur la production des contextes syntaxiques (exemple du
mot livre) ;
- Rédiger (page HTML) une présentation du corpus et
de la méthode de production des contextes syntaxiques ;
- Classer les constructions et attirances sur le plan syntaxique
manifestées par le mot
choisi et faire des hypothèses sur les emplois
correspondants ;
- Calculer l'information mutuelle et des graphes basées sur
l'information mutuelle à partir des données disponibles
(cf. cours
4) ;
- Intégrer les renseignements fournis par l'information
mutuelle dans la description des constructions et attirances.