B. Habert
Projet Communautés

Cours 5

Objectif

Décrire les emplois (et éventuellement les sens) de noms de Romanseval.

Il y a 20 noms. On commencera par ceux pour lesquels les contextes sont les moins nombreux. Les noms seront répartis entre les membres du projet.

Angles d'attaque

Repérer les contraintes d'emploi

Un certain nombre d'approches permettent de mettre en évidence les micro-constructions dans lesquelles figure un mot, les attirances qu'il entretient :

Organiser les emplois

Les attirances et les micro-constructions sont structurées par les emplois du mot. Par exemple, barrage rentre dans la construction faire barrage quand il s'agit d'un emploi "politique", dans tir de barrage ou match de barrage pour l'emploi sportif, et dans franchir un barrage pour l'emploi militaire ou policier.

Les zones denses du graphe des attirances entre mots fournissent un repérage grossier des emplois, avec des intersections et des limites quand le graphe est trop fourni et trop enchevêtré.

D'autres méthodes peuvent aider à organiser les emplois : les classifications des phrases contenant le mot (avec DTM de Ludovic Lebart par exemple).

Démarche

  1. Choisir un mot à décrire ;
  2. Examiner le résumé de ses contextes syntaxiques principaux en lisant les informations sur le corpus LM10 et sur la production des contextes syntaxiques (exemple du mot livre) ;
  3. Rédiger (page HTML) une présentation du corpus et de la méthode de production des contextes syntaxiques ;
  4. Classer les constructions et attirances sur le plan syntaxique manifestées par le mot choisi et faire des hypothèses sur les emplois correspondants ;
  5. Calculer l'information mutuelle et des graphes basées sur l'information mutuelle à partir des données disponibles (cf. cours 4) ;
  6. Intégrer les renseignements fournis par l'information mutuelle dans la description des constructions et attirances.