RESUME: Gaston
GROSS, Septembre 1994, "Classes
d'objets et description des verbes", Langages n°115, Larousse, Paris
Dans cet article, Gross
montre
tout d'abord que la polysémie des opérateurs de classement sémantique
n'est
pas résolue par des principes de philosophie analytique ou
psychologique bien
souvent plus intuitifs et rationnels que scientifiquement motivés. Il
prend pour ce faire le traitement de la classe des concrets. Il est
courant de considérer que ce qui est concret est perceptible par les
sens, or des mots comme table
et bruit, qui désignent des
réalités perceptibles par les sens, ne se comportent pas de la même
façon: il s'est produit un bruit
mais *il s'est produit une table,
une table se trouvait là autrefois
mais *un bruit se trouvait là
autrefois. De
cette
constatation, il propose de traiter ce problème de polysémie en
utilisant le
langue elle-même, et plus particulièrement la syntaxe. Pour déterminer
le
champs sémantique d'un mot, il faudrait alors quel(s) verbe(s)
est(sont)
appelé(s) par ce mot.
Gross remarque cependant que ce
principe
des traits syntactico-sémantiques pose deux problèmes. D'une part, il
peut
être risqué de se référer au verbe appelé par le mot étudié car les
verbes aussi sont polysémiques.
D'autre part, ce principe peut entraîner une surgénération de
structures
qui fausse l'analyse. En effet, en considérant la phrase Luc
a
émondé ce lilas, une structure du type émonder+Nconcret
peut être
déduite, ce qui pourra générer des phrases incorrectes comme Luc a
émonder
cette table/ce clou.
Selon l'auteur, la
solution
de ces problèmes consisterait
à continuer de se servir de traits syntactico-sémantiques en relevant
les
verbes adéquats pour la lexie mais de compléter ces traits par
la
description
des arguments des verbes. Ainsi, Gross considère que les traits
syntaxiques
sont sous-catégorisés par des classes sémantiques qui sont déterminées
par des
opérateurs. Il considère alors les opérateurs dits "généraux" qui
sont des propriétés syntaxiques propres à un trait et motivant la mise
au
point d'un trait. Il dénombre ainsi 8 traits: humain, animal ,
végétal,
inanimé concret, inanimé abstrait, locatif, temps, événement. Gross
codera ainsi les substantifs du lexique. Il entreprend ensuite de
décrire deux
de ces traits.
Il commence par le trait humain. Pour le
décrire, Gross se
sert du principe syntaxique des opérateurs appropriés à chaque
substantif
pour déterminer 54 classes d'objets qui sous-catégorisent le trait
comme par
exemple loc (locatif) pour parisiens, allemands, européens(...)
ou rel(relationnel) pour frère, mère, cousin (...)
. Il
montre alors qu'avec ce principe, il est possible d'affiner la
description afin
de classer l'ensemble des noms du lexique: soit T le trait, C
la
classe d'objet, Op un verbe associé, S un synonyme et D
le
domaine on a par exemple
- ébauche/T:hum/C:écr/Op:/S:esquisse/D:litt.
où hum = humain, écr = écrit et litt =
littérature
- éboueur/T:hum/C:pro/Op:/S:boueux/D:urban.
où hum = humain, pro = profession et urban =
urbanisme
Gross décrit ensuite le trait inanimé concret,
toujours en se servant des opérateurs appropriés. Pour ce
faire, il
aborde la polysémie de prendre et observe ses emplois,
c'est-à-dire ses
différents arguments. Il utilise également les synonymes de prendre
afin de mieux en cerner l'ambiguïté sémantique et parvient alors à
discerner
trois types d'argument: abstrait, locatif et concret.
C'est sur
ce dernier que Gross se penche plus particulièrement. Il s'aperçoit
qu'un
grand nombre de substantifs sont des arguments de prendre et
sont
conformes avec les opérateurs du trait inanimé concret.
Il en
dresse la liste la plus exhaustive possible afin d'avoir à chercher des
opérateurs appropriés les plus fins possible et de dégager d'autres
classes
d'objets, chacune ayant ses opérateurs propres. Par exemple, pour NO
représentant le nom sujet et N1 l'objet du verbe:
- annoncer un retard de n minutes/NO:mt-f où mt-f
= moyen de transport ferroviaire
- voyager
par/NO:hum/N1:mt-fc
où hum = humain et mt-fc = moyen de transport ferroviaire
en
commun
Bien que plus poussée et
motivée,
cette analyse est insuffisante selon Gross car elle ne traite ni les
modifications de l'opérateur ni la nature de la détermination de
l'objet. Sur
le premier point, il s'agit de savoir prévoir si deux emplois d'un mot
comme prendre
correspond à un ou deux sens de ce mot comme dans prendre un steack
et prendre
un médicament. Lorsque
l'on transforme ces groupes verbaux en groupes nominaux, on
obtient *la prise d'un steack
et la prise d'un médicament.
Ainsi, l'auteur
montre
que les modifications de l'opérateur ne sont pas des caractéristiques d
'un opérateur morphologique
mais
bien une propriété transformationnelle. Sur la nature de la
détermination
de l'objet, Gross
considère que l'objet est déterminé au sein du
GN
mais aussi par la relation sémantique comme
verbe et
complément. Par exemple, bêtise peut être considérer comme
comptable Luc
a fait une bêtise mais comme non comptable dans Luc
multiplie
les
bêtises. Gross propose alors de déterminer une typologie des
déterminations grâce aux relations opérateurs-arguments dans le but de
créer
un codage des déterminations trouvées qui permettra de prédire la forme
de
détermination potentielle.
Pour conclure, Gross remarque
que la
constitution de classes d'objets permet de traiter automatiquement les
problèmes
d'ambiguïté, l'emploi des prépositions et de mettre en évidence la
synonymie
que ce soit des prédicats verbaux, adjectivaux ou nominaux.
L'application de
cette notion de classe d'objet est alors particulièrement utile en
traduction
automatique.
RESUME: Denis LE PESANT, Septembre 1994, "Les composants nominaux du verbe lire : une illustration de la notion de
"classe d'objets" ", Langages n°115, Larousse, Paris
Dans cet article, Le Pesant étudie les
conséquences des apports faits au lexique-grammaire
depuis 20 ans
(notamment par Gross) sur le lexique-grammaire actuel. Le
lexique-grammaire est défini comme un classement sémantique obtenu au
moyen de critères et de tests syntaxiques. Les études
réalisées ont montré que, pour classer un mot, il faut décrire les
emplois d'un mot c'est-à-dire les informations syntaxiques et sémantiques
sur ce
mot. Par exemple, pour classer les noms arguments de lire, il faut dresser la liste des
noms qui peuvent être sujet ou objet de ce verbe puis discriminer ces
noms en étudiant les relations syntaxiques qu'ils entretiennent avec le
verbe. Ainsi, on peut lire un décret
ou lire un journal mais
dans la construction lire un décret
dans un journal, il n'est pas possible d'inverser N1 et N2
(les objets): *lire un journal
dans un décret; ce qui amène Le Pesant à penser que ces deux
noms ne se classent pas de la même façon (décret
est une écriture tandis que journal est un support d'écriture). Il définit
alors les classes d'objets "par les relations syntaxiques qu'elles
entretiennent avec une ou plusieurs classes de verbes appelés
opérateurs appropriés".
Cependant, Le Pesant
déplore que ces méthodes autorisent des constructions peu probables en
réalité telles que lire une épopée
sur un ticket de métro. Il souhaite donc faire que la grammaire
permette de prévoir les distributions les plus probables. Pour ce
faire, il propose de subdiviser les ceffet, lasses d'objets grâce aux
opérateurs appropriés et constituer un arbre dont les noeuds filles
seraient des classes d'objets de plus en plus fines et contraintes. En
plus un
codage est précis, plus on peut classer de phrases et plus ce
classement sera précis. On peut ainsi différencier l'agrammaticalité de
la faible probabilité d'occurrence alors même que cette nuance est
rarement prise en compte et ne peut l'être si les critères ne sont pas
assez précis. Par
exemple, la classe des supports
d'écriture peut se subdiviser en
s-i (support imprimé) et s-ms(support
manuscrit) car une construction peut être gammaticale avec livre (qui est s-i) et
agrammaticale avec bloc-note (qui
est s-ms): cette entreprise affiche des livres
mais *cette entreprise affiche des
bloc-notes. L'auteur poursuit alors sa subdivision de classes
de manière précise, suivant ce modèle.
Le Pesant
remarque néanmoins que, si ce système est efficace et utile, il est
tout de même insatisfaisant car toutes les classes ne sont pas
disposées en ordre hiérarchique. En effet, certaines lexies, comme signe, ont une "double
appartenance" c'est-à-dire qu'elles appartiennent à plusieurs
classes, tout comme signe
appartient à la fois à la classe des imprimés
sur lesquels on peut écrire quelque chose(s-i-npl) et à la
classe des supports d'écriture
manuscrite non composée de plusieurs pages (s-ms-npag). Il est
vrai qu'un grand nombre de noms apparaît sous deux entrées. Le Pesant
propose pour résoudre ce problème de créer des classes rassemblant les
classes de la lexies ambigüe. Pour signe, la nouvelle classe
est <
<s-i-npl><s-ms-npag> >.
Ensuite, l'auteur aborde le
fait qu'une
classe d'objets peut être déterminé par une transformation reliant deux
structures de phrases. De même, une classe d'objet peut hériter par
transformation des opérateurs d'une autre classe d'objet. On remarque
par exemple pour le mot quotidien (classé
é-t-pnp : écrits périodiques
et non périodiques): de lire
un numéro de quotidien, on passe à lire un
quotidien (or numéro de est un
support d'écriture) ; soit en
d'autres termes :
(numéro)de<é-t-pnp> ->
<é-t-pnp>.
Ainsi,
pour Le Pesant, si le vocabulaire est riche et précis alors les
opérateurs appropriés suffisent pour effectuer un classement et si une
même classe est très riche alors il faut la subdiviser en classes plus
précises et moins volumineuses grâce aux opérateurs appropriés. Mais il
arrive aussi que les opérateurs appropriés manquent, ce qui bloque
l'analyse. Dans ce cas, il faut utiliser les parties appropriées,
c'est-à-dire déterminer à l'aide de critères syntaxiques une
subdivision de la classe. Des structures qui indiquent que la classe
obtenue fait partie d'un tout qu'est la classe d'origine sont utilisées
comme critères syntaxiques. Par exemple, dans je lis le dénouement d'une comédie,
le dénouement est une partie
du tout qu'est la comédie. On
note alors N0 lire [le(s)N de un N']N1 où N= partie N' = tout. Cette
méthode dite des parties appropriées est utile pour définir de petites
classes contenant même parfois des objet individuels et elle permet de
décrire des relations non seulement avec des
verbes mais aussi avec des
noms.
Pour conclure
, Le Pesant note que son étude vise à
construire une lexicographie la plus précise et la plus
prévisible
possible afin de mettre au point un dictionnaire électronique
performant. Il
remarque enfin que son
dictionnaire a pour entrée des phrases, et non des mots, puisque les
classes d'objets entretiennent des relations syntaxiques avec d'autres
classes d'opérateurs, ce qui signifie qu 'il s'agit de relations entre
classes de prédicats et domaines d'arguments.
REMARQUES SUR LES
DEUX TEXTES
La visée des textes
L'étude de Gross vise une application en traduction
automatique
(TA) ou bien l'élaboration d'un analyseur syntaxique. En ce qui concerne la TA, il
montre dans son article (p 18) que l'analyse en classes peut se
présenter
sous la forme d'un arbre où il établit une relation hiérarchique.
Cependant, il montre que dans un traducteur automatique se servant de
ce modèle (comme SYSTRAN), le codage des classes est si raffiné que
pour
des raisons pratiques on ne se sert pas de tous les codages mais
d'environ une dizaine. Le codage spécifique trouve aussi son
application au sein d'un analyseur syntaxique (p 21)qui
reconnaîtrait
les relations opérateur-arguments dans un texte donné. Le travail de
Gross est une démarche scientifique : "c'est la seule démarche qui
permette de dégager des règles reproductibles"p 22.
Le Pesant a des visées plus lexicales.
Son travail est la suite de celui de Gross mais pour des applications
différentes. Son objectif est de créer un dictionnaire électronique
performant en utilisant des critères syntactico-sémantiques. Ce
dictionnaire se servira des relations entre les classes de prédicats et
des domaines d'arguments, ce qui aboutit classer dans le dictionnaire
des phrases à la place des mots.
La
bibliographie
Les travaux n'ayant pas le même
but, ils sont abordés différemment et par conséquent les bibliographies
contrastent. Gross compte des ouvrages syntaxiques aux auteurs de
références (Chomshy,
Harris), tandis que Le Pesant est orienté vers la
sémantique. Tous deux ont pour référence Kayser et Kleiber,
Mathieu-Colas et Guillet, ce qui montre que tous deux partent des
mêmes bases pour aboutir à des résultats qui s'apportent des
informations mais pour des applications différentes. Par ailleurs,
Gross est une des références de Le Pesant( mais l'inverse n'est pas
vrai).
Définitions
des termes
Les deux auteurs sont
d'accord sur les définitions, Le Pesant
vient compléter les théories de Gross. Il faut retenir les notions
définies par Gross puis redéfinies par Le Pesant de classe d'objets
et d'opérateurs appropriés. La classe d'objet, pour compléter ce qui
est
expliqué dans les résumés, est l'unité minimale de distribution, elle
permet
de dégager les différents emplois des opérateurs. Les opérateurs
appropriés motivent la détermination d'un argument et représentent
l'ensemble des propriétés propres à un trait. Le Pesant va plus loin en
définissant des notions comme la transformation, et les parties
appropriées. En effet, les classes d'objets sont définies certes par
des propriétés syntaxiques mais aussi par des propriétés
transformationnelles(p 40 et résumé). De même, il peut arriver que
les opérateurs appropriés ne suffisent pas pour procéder à un
classement, Le Pesant montre que l'on peut alors avoir recours aux
parties appropriées (p 44 "objets dotés d'opérateurs
appropriés et
qui appartiennent à la classe d'ensemble considérée", exemple dans le
résumé).