Serge Fleury

Maître de Conférences en linguistique informatique Sorbonne nouvelle, Paris 3
Membre du SYLEDED268

ILPGA / Sorbonne nouvelle
 

 

 

 

 

 

 

 

 

 

 

Chapitre 6

 

 

Le prototype veut enfin représenter : un nouveau type de moulin

6.1. Représentation dynamique de la construction du sens des séquences en moulin à N2

6.1.1. "Moulin" est avant tout une machine

 

 

Le noyau de sens attaché à "moulin" doit tendre à tracer une direction "sémantique" adéquate pour la description de "moulin" comme instrument. Il s'agira ensuite de détacher dans les comportements sémantiques définis ceux qui relèvent plus généralement de la classe des noms d'instrument, tout en permettant de retrouver ces informations particulières dans cette classe de noms et notamment celles qui concernent le comportement sémantique de "moulin" (mise en oeuvre d'héritage de comportement sémantique). On peut d'ailleurs s'interroger sur le fait de savoir si ce processus d'abstraction est cohérent avec une approche prototypique.

 

Figure 6.1 : Moulin est avant tout une machine.

6.1.2. "Moulin" fonctionne aussi comme un opérateur syntaxique qui prend en arguments une préposition et un nom

 

 

"moulin à blé" "moulin à farine"...

 

On associe à moulin un prédicat dont la valeur prédicative dépend du N2.

 

On se place donc ici dans une approche qui élargit la notion de prédicativité nominale à des constituants autres que des déverbaux : "C'est dire que certains noms, bien que n'étant pas des déverbaux, n'en disposent pas moins d'un cadre argumental qui restreint les interprétations possibles des autres constituants du composé" (Habert & Jacquemin 1993). On peut en effet considérer que "moulin" implique un changement d'état qui recouvre plusieurs réalisations lexicales suivant que l'argument soit un objet fabriqué, soit un produit naturel ou un nom d'énergie. On peut ainsi définir un prédicat générique unique faire-changer-d'état dont les manifestations lexicales dépendent de l'argument.

 

 

Figure 6.2 : Sous-spécification du prédicat associé à moulin.

 

 

Ce choix permet tout d'abord de maintenir une représentation qui s'accorde avec bon nombre de noms d'instrument; ensuite, la sous-spécification du prédicat en transformer ou créer peut être vue soit comme un problème de spécialisation lexicale, soit comme un phénomène de co-compositionalité.

 

Si N2 est un produit naturel, la valeur prédicative traduit une transformation.

 

un moulin à blé transforme du blé en farine

 

Si par contre, le N2 est un artefact, celle-ci traduit plutôt une création.

 

un moulin à farine est un moulin qui crée de la farine

6.1.3. Moulin et les prototypes

 

 

Moulin est un opérateur : notre prototype moulin initial peut déclencher la construction d'un prototype moulin à N2 qui sera construit s'il est possible de lui adjoindre un prototype Prep de forme "à" et un prototype de catégorie Nom en position N2.

Figure 6.3 : Un prototype pour moulin à blé

 

 

Moulin à farine peut être associé à un prototype obtenu par clonage et ajustement du prototype associé à moulin à blé.

 

Figure 6.4 : Un prototype pour moulin à farine

6.1.4. Moulin à paroles peut être vu comme une spécialisation

 

 

Moulin à paroles peut être associé au prédicat créer : création d'un excès de paroles.

Moulin à Paroles désigne une entité de type +humain : une personne qui telle une machine produit une grande quantité de paroles.

• Création du prototype moulin à paroles par différenciation du prototype moulin à farine.

 

 

Figure 6.5 : Un prototype pour moulin à paroles

6.1.5. Moulin à paroles peut être vu comme une généralisation : un nouveau type de moulin

 

 

Les emplois métaphoriques permettent d'élargir la prise en compte des N2 de type Nparole.

 

moulin à coups, moulin à systèmes, moulin à thèmes anglais, moulin à images, moulin à ennui ...

 

• Changement d'état du processus de création de l'argument donné : production massive, importante...

 

• Reconfiguration de la représentation initiale.

 

• Création d'un prototype moulin à N2 : une machine abstraite.

 

• Le prototype moulin à N2 est, par défaut, un instrument de transformation ou de création.

 

La sémantique initiale attachée au prototype moulin à N2 est sous-déterminée : moulin est un instrument et la valeur prédicative associée à ce prototype est Faire-Changer-D'état.

 

• Le prototype moulin à N2 peut décrire un Nhumain.

 

Si les valeurs lexicales et/ou sémantiques attachées au N2 vérifient les filtres mis en place dans le calcul sémantique développé par le prototype moulin à N2, celui-ci peut déclencher la construction de nouveaux prototypes moulin à N2 "spécialisés" qui ajustent la sémantique initiale ou qui la redéfinissent.

 

• Ajustement des valeurs sémantiques et ajout de valeurs sémantiques supplémentaires.

 

 

Le prototype moulin à N2 est donc défini prototypiquement de manière sous-déterminée, i.e. la représentation initiale construite lui associe la sémantique suivante : {classe : Instrument, valeur prédicative : Faire-Changer-D'état, traits : Artefact, Concret, Inanimé,...}. L'analyse d'une réalisation donnée pourra étendre cette représentation et construire, par clonage et ajustement, un prototype moulin à N2 dont la sémantique précisera ces valeurs initiales. La figure 6.6 présente une illustration de la représentation initiale du prototype moulin à N2 prédéfini et des ajustements que ce dernier peut générer dans la construction de nouveaux prototypes moulin à N2.

 

La construction sémantique des composés en moulin à N2 propose une interprétation privilégiée : un moulin est avant tout un nom de la classe instrument, la sémantique "de base" pour moulin porte la valeur prédicative Faire-Changer-D'état. C'est le "poids" de moulin (du N1 dans le composé en N1 à N2) qui déclenche la construction sémantique du composé visé; celle-ci peut à son tour être modifiée en tenant compte des informations co-textuelles rencontrées : en l'occurrence, le "poids" sémantique du N2 peut sous-spécifier cette sémantique initiale soit la respécifier.

 

• Si l'on rencontre une séquence nouvelle, il reste possible à partir des interprétations existantes, de construire une nouvelle interprétation.

 

• Clonage du prototype adéquat puis ajout ou retrait dynamique d'informations.

 

Ces ajustements peuvent être réalisés "à la main" : mise à jour dynamique des attributs des prototypes visés. Si l'on dispose de méta-connaissances qui permettent de mettre en lumière les informations pertinentes qui éclairent une nouvelle interprétation, ces ajustements peuvent être réalisés via l'utilisation de méthodes idoines : mise en place de comportements généraux partagés dans les traits, ou de comportements spécifiques au niveau des prototypes rencontrés.

 

Ce prototype de référence constitue un point d'entrée très général qui se précise petit à petit si l'inférence le nécessite. Cette solution permet à la fois de tenir compte des savoirs déjà connus (une interprétation privilégiée est mise en avant), elle permet aussi de créer de toutes pièces de nouvelles interprétations par spécialisation ou remodelage. Elle permet enfin de laisser ouverte le modèle de représentation construit. Rien n'empêche de construire une nouvelle interprétation en modifiant les prototypes construits par ce modèle et en ajustant dynamiquement leur représentation. On peut par exemple cloner le prototype moulin à N2 générique et modifier dynamiquement ces attributs pour produire une interprétation différente de celles qui sont présentées dans les figures précédentes.

 

 

 

Figure 6.6 : Un nouveau type de moulin.

 

6.2. Extension du domaine de l'analyse

 

 

Cette phase de développement d'une implémentation d'un analyseur syntaxique (guidé par des prototypes) poursuit le travail initié dans le chapitre précédent pour ce qui concerne la mise au point de l'analyse et s'appuie sur le "travail théorique" de la construction du sens des formes moulin à N2 initié au départ et résumé en partie ci-dessus.

6.2.1. Du côté de l'analyse

 

 

L'utilisateur peut choisir de tracer (ou non) l'analyse, d'afficher (ou non) les prototypes construits à l'issue de l'analyse. De plus, si l'on travaille sur une station couleur (un moniteur 8-bit supportant la version Self 3.0), il est aussi possible d'activer (ou non) une trace graphique de l'évolution de l'analyse. On peut ainsi activer l'affichage des prototypes extraits, sélectionnés, construits au cours de l'analyse (en parallèle au traçage dans le shell). En fin d'analyse, la fenêtre de la trace graphique présente les prototypes construits à l'issue de l'analyse : la présentation est limitée à certains attributs : pour un affichage complet des objets, il convient d'utiliser les outils mis en place par Self pour effectuer la présentation des attributs souhaités. On donne infra une présentation du résultat graphique obtenu.

Déroulement de l'analyse

 

Le prototype manager gère toutes les activités de l'analyse.

 

• a. Lecture de la phrase ou suite de mots donnée en entrée.

 

• b. Recherche pour chacun de ces mots s'il existe des prototypes ayant un attribut forme qui porte la même valeur que le mot donné.

 

• c. Le prototype manager enregistre les prototypes qui répondent correctement à l'étape précédente.

 

• d. Recherche des prototypes à construire :

 

Pour chacun des prototypes initiaux, le manager vérifie si ces prototypes sont syntaxiquement créateurs de prototypes de plus grande portée (syntaxique) : par exemple, un prototype dont l'attribut catégorie porte la valeur Nom peut déclencher la construction de prototypes représentant des syntagmes nominaux, un "protototype verbe" peut déclencher la construction d'un "prototype syntagme verbal" etc. Le prototype manager effectue cette "vérification" en lisant les informations adéquates dans un dictionnaire qui, à chaque entrée (une catégorie du type det, Nom, V, Sn...) associe la liste des prototypes qu'il est possible de construire à partir d'un prototype qui porterait une valeur catégorielle identique à celle de l'entrée. Si le manager peut associer à un prototype donné un nouveau prototype à construire, le prototype initial est adjoint au nouveau prototype à construire à la place que ce dernier lui réserve et le nouveau prototype à construire est adjoint à la liste des prototypes à construire au cours de l'analyse. Les prototypes initiaux constituent en fait les prototypes "majeurs" pour la construction de ces prototypes de plus longue portée : un prototype de valeur catégorielle Nom peut être qualifié de prototype majeur pour la construction éventuelle d'un prototype de valeur catégorielle Sn ou N1 à N2. L'analyse se déroulera donc, par la suite, de manière bi-directionnelle : sur la droite pour la construction du prototype N1 à N2 (ajout d'un prototype Nom, en position N1, puis d'un prototype Prep et enfin d'un prototype Nom, en position N2) et sur la gauche pour le prototype Sn (ajout d'un prototype Nom puis d'un prototype Det). Le dictionnaire des prototypes à construire est défini de la manière suivante :

 

Ce dictionnaire est créé par clonage de la structure définie par Self pour représenter un dictionnaire. Les entrées de ce dictionnaire sont les catégories qui déclenchent la construction d'un prototype et les valeurs associées à ces entrées sont les listes des prototypes à construire pour ces entrées: dictOfProtoToBuild at: 'catégorie' Put: {prototype 1, prototype 2...}.

 

_AddSlotsIfAbsent: ( | dictOfProtoToBuild | )

dictOfProtoToBuild: dictionary copy

dictOfProtoToBuild at: 'Vt' Put: (vector copy) asList

(dictOfProtoToBuild at: 'Vt' ) addLast: (catSVtSn copy)

(dictOfProtoToBuild at: 'Vt' ) addLast: (catSVtClit copy)

dictOfProtoToBuild at: 'Nom' Put: (vector copy) asList

(dictOfProtoToBuild at: 'Nom' ) addLast: (catN1aN2 copy )

(dictOfProtoToBuild at: 'Nom') addLast: (catN1aV copy)

(dictOfProtoToBuild at: 'Nom' ) addLast: (catSn copy)

(dictOfProtoToBuild at: 'Nom' ) addLast: (catAdjN copy)

dictOfProtoToBuild at: 'AdjN' Put: (vector copy) asList

(dictOfProtoToBuild at: 'AdjN' ) addLast: (catSnAdjN copy)

dictOfProtoToBuild at: 'N1aN2' Put: (vector copy) asList

(dictOfProtoToBuild at: 'N1aN2' ) addLast: (catSnN1aN2 copy)

dictOfProtoToBuild at: 'MoulinaN2' Put: (vector copy) asList

(dictOfProtoToBuild at: 'MoulinaN2' ) addLast: (catSnMoulinaN2 copy)

dictOfProtoToBuild at: 'MoulinaVinf' Put: (vector copy) asList

(dictOfProtoToBuild at: 'MoulinaVinf' ) addLast: (catSnMoulinaVinf copy)

dictOfProtoToBuild at: 'Sn' Put: (vector copy) asList

(dictOfProtoToBuild at: 'Sn' ) addLast: (catP copy)

 

Le contenu du dictionnaire des prototypes à construire est restreint aux entités nécessaires pour les analyses présentées. Il convient donc d'ajuster ce dictionnaire pour élargir le champ de l'analyse.

 

 

1. Le prototype manager a construit un prototype Nom;

2. Le prototype manager vérifie dans le dictionnaire des prototypes à construire la liste de ces prototypes dont ce prototype est potentiellement créateur (si elle existe);

3. Si cette liste n'est pas vide, le prototype manager créé les prototypes adéquats et leur adjoint le protype Nom à la position adéquate : en position N1 dans le prototype N1 à N2 et en position Nom dans le prototype Sn

4. Le prototype manager enrichit sa liste des prototypes à construire.

 

Figure 6.7 : Construction ascendante de prototypes pour l'analyse.

 

Nous nous plaçons dans une approche de représentation qui manipule a priori des structures de représentation sous-déterminées que les processus mis en place doivent pouvoir affiner dès que de nouvelles informations sont disponibles. Le choix d'une analyse montante s'inscrit dans cette approche : on construit les choses de "haut niveau" à partir d'éléments de "bas niveau".

 

• e. Construction de nouveaux prototypes :

 

L'analyse se poursuit donc en prenant appui sur la liste des prototypes à construire. Pour chacun d'eux le manager essaie de lui adjoindre un des prototypes construits disponibles. Le prototype manager qui gère les activités de l'analyse va chercher à adjoindre les prototypes disponibles à droite ou à gauche des prototypes sélectionnés. Cette adjonction de prototypes tient compte des contraintes suivantes :

 

 

Figure 6.8 : Les prototypes se multiplient au cours de l'analyse.

 

 

1. A chaque fois que l'analyse construit un prototype, le point d est activé : recherche des nouveaux prototypes à construire à partir des prototypes construits. La figure 6.8 reprend l'exemple présenté ci-dessus.

 

2. La construction d'un prototype peut aussi s'accompagner, en préalable à la construction effective de ce prototype, du clonage du prototype sélectionné : on maintient le prototype sélectionné "actif" (susceptible de recevoir une adjonction de composants) pour ne pas restreindre la construction d'un seul prototype. Dans la figure 6.9, la construction du prototype Sv (V Sn) s'accompagne, avant l'adjonction du prototype Sn au prototype Sv, du clonage du prototype Sv (V *) qui attend une adjonction éventuelle d'un prototype de valeur catégorielle Sn. Cette adjonction sera réalisée par la suite dès que le prototype Sn (Det N1àN2) sera disponible.

 

Figure 6.9 : Clonage d'un prototype à construire.

 

 

• f. L'analyse s'arrête dès que l'on ne construit plus de prototypes et que l'on ne trouve pas de nouveaux prototypes à construire (Points 1 et 2 précédents).

 

 

La figure suivante présente le déroulement de l'analyse sur "Une petite brise la glace". On donne aussi une trace du résultat graphique issu de l'analyse sur cette même phrase.

 

 

 

Figure 6.10 : Déroulement d'une analyse sur : "Une petite brise la glace" (1)

 

 

 

 

 

 

 

Dans la trace graphique qui suit, on présente le résultat de l'analyse obtenu sur "une petite brise la glace". Les prototypes <object 244> et <object 245> représentent cette phrase : <object 244>porte les attributs sn et sv associés aux objets <object 246>, <object 241>qui représentent respectivement "une petite brise" et "la glace", <object 245>porte les attributs sn et sv associés aux objets <object 247>, <object 243>qui représentent respectivement "une petite " et "brise la glace"

 

 

Figure 6.10 : Résultat d'une analyse sur : "Une petite brise la glace" (2)

 

6.2.2. Du côté des "moulin à N2"

 

 

Le prototype moulin peut, à l'image de tous les prototypes représentant des Noms, construire un prototype N1 à N2 (<- dictionnaire des prototypes à construire). Ce dernier peut sous-spécifier sa construction suivant la valeur du N1 qu'on lui adjoint. La construction d'un composé en N1 à N2 peut ainsi déclencher la construction de prototypes spécialisés suivant la forme lexicale du N1 rencontré. Le prototype N1 à N2 se construit donc s'il est possible de lui adjoindre un prototype Prep de forme à puis un prototype Nom en position N2. Il déclenche ensuite la construction d'un prototype spécialisé moulin à N2 qui effectue une (tentative de) construction sémantique du composé ainsi formé. Le déclenchement de la construction de ce prototype spécialisé est activé par le prototype N1 à N2 via la lecture d'un dictionnaire des prototypes spécialisés qui a l'allure suivante :

 

_AddSlotsIfAbsent: ( | dictOfSpecializedProto | )

dictOfSpecializedProto: dictionary copy

 

dictOfSpecializedProto at: 'moulin' Put: (vector copy) asList

(dictOfSpecializedProto at: 'moulin' ) addLast: (catMoulinaN2 copy)

(dictOfSpecializedProto at: 'moulin' ) addLast: (catMoulinaVinf copy)

 

 

Là encore le contenu de ce dictionnaire est restreint à la construction particulière des séquences en moulin à N2. Il convient donc d'ajuster ce dictionnaire pour élargir le champ de la construction sémantique des composés N1 à N2. Si l'on étudie, par exemple, plus avant la construction des séquences en Boîte à N2, il suffit de complèter le dictionnaire ainsi défini.

 

Figure 6.11 : Construction du sens des composés en moulin à N2 (Phase10).

 

 

Le prototype moulin à N2 est défini prototypiquement de manière sous-déterminée, i.e. la représentation initiale construite lui associe la sémantique suivante : {classe : Instrument, valeur prédicative : Faire-Changer-D'état, traits : Artefact, Concret, Inanimé,...}. L'analyse d'une réalisation donnée pourra étendre cette représentation et construire, par clonage et ajustement, un prototype moulin à N2 dont la sémantique précise ces valeurs initiales. La figure précédente présente une illustration de la représentation initiale du prototype moulin à N2 prédéfini et des ajustements que ce dernier peut générer dans la construction de nouveaux prototypes moulin à N2. Si les valeurs lexicales et/ou sémantiques attachées au N2 vérifient les filtres mis en place dans le calcul sémantique développé par le prototype moulin à N2, celui-ci peut déclencher la construction de nouveaux prototypes moulin à N2 "spécialisés" qui ajustent la sémantique initiale ou qui la redéfinissent. La construction sémantique des composés en moulin à N2 propose une interprétation privilégiée : un moulin est avant tout un nom de la classe instrument, la sémantique "de base" pour moulin porte la valeur prédicative Faire-Changer-D'état. C'est donc le "poids" de moulin (du N1 dans le composé en N1 à N2) qui déclenche la construction sémantique du composé visé; celle-ci peut à son tour être modifiée en tenant compte des informations co-textuelles rencontrées : en l'occurrence, le "poids" sémantique du N2 peut sous-spécifier cette sémantique initiale ou la remodeler.

 

Figure 6.12 : Clonage et ajustement de prototype moulin à N2 au cours de l'analyse.

 

 

Les prototypes P(X) éventuellement définis au cours de l'analyse ne sont pas préconstruits comme des prototypes mais existent potentiellement dans la représentation définie par le prototype moulin à N2 (Création paresseuse). C'est la validation des filtres associés qui induit leur création. Ce qui revient à dire qu'il est nécessaire d'ajuster ces filtres si d'autres prototypes P(X) sont nécessaires; il est aussi possible d'ajuster la pré-représentation de ces prototypes dans la représentation qui est faite du prototype moulin à N2 initial : on peut de nouveau ajuster la représentation des prototypes construits P(X), il convient pour cela de définir les conditions de cet ajustement et la réalisation de cette spécialisation.

 

Les figures qui suivent présentent une illustration graphique des prototypes construits à l'issue d'analyses de séquences en moulin à N2.

 

 

Figure 6.13 : Un réseau de prototypes pour moulin à blé

 

 

Comme précédemment, la trace graphique d'une analyse propose le cas échéant un résultat de l'analyse via l'interface graphique de Self. La figure précédente présente les objets issus d'une analyse de la séquence "moulin à ble". Le prototype <object 134> représente le prototype N1 à N2 construit à partir de moulin (à partir du prototype <object 61> représentant moulin), ce prototype a pour composants les objets <object 61>, <object 12>, <object 5> (représentant respectivement moulin, ble, a) portés par les attributs n1, n2, prep. Le prototype <object 135> représente un prototype moulin à N2 représentant moulin à blé construit à partir du précédent et avec les mêmes composants : la sémantique de <object 135> est portée par <object 137> dont les attributs portent les valeurs associées à cette sémantique via les objets <object 138>, <object 139>, <object 141>.

 

 

Figure 6.14 : Un réseau de prototypes pour moulin à farine

 

 

La figure précédente présente les objets issus d'une analyse de la séquence "moulin à farine". Le prototype <object 126> représente le prototype N1 à N2 construit à partir de moulin (à partir du prototype <object 61> représentant moulin), ce prototype a pour composants les objets <object 61>, <object 38>, <object 5> (représentant respectivement moulin, farine, a) portés par les attributs n1, n2, prep. Le prototype <object 127> représente un prototype moulin à N2 représentant moulin à blé construit à partir du précédent et avec les mêmes composants : la sémantique de <object 127> est portée par <object 129> dont les attributs portent les valeurs associées à cette sémantique via les objets <object 130>, <object 131>, <object 133>.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Figure 6.15 : Un réseau de prototypes pour moulin à paroles

 

 

La figure précédente présente les objets issus d'une analyse de la séquence "moulin à paroles". A la différence des deux figures précédentes, l'analyse produit ici deux prototypes moulin à N2 porteurs de deux sémantiques différentes : <object 100> décrit un instrument de création, <object 100> décrit un NHumain.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Figure 6.16 : Un réseau de prototypes pour moulin à prieres

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Figure 6.17 : Un réseau de prototypes pour moulin à vent

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Figure 6.18 : Un réseau de prototypes pour moulin à ventilateur

 

 

 

 

On donne aussi une illustration de l'analyse de la phrase "Le manager analyse un moulin à paroles". Le résultat de l'analyse présenté pour cette phrase dans la figure 6.19 propose la construction de quatre prototypes disctincts couvrant la phrase initiale; en effet l'analyse du syntagme verbal n'impose pas encore de contraintes sur la valeur sémantique du composé qui est adjoint au syntagme nominal composant ce groupe verbal. Comme notre analyse propose de ne pas restreindre les interprétations des composés (on construit tous les possibles, tout au moins on essaie), chacun de ces composés construits permet de poursuivre une analyse particulière. Les prototypes P obtenus se distinguent donc par la valeur sémantique attachée au prototype associé à la séquence moulin à N2 présente dans la phrase initiale.

 

Figure 6.19 : Des prototypes pour le manager analyse un moulin à paroles

 

 

 

6.3. Traitement Automatique du Langage Naturel et Prototypes

6.3.1. Représentation prototypique et stabilisation des savoirs

 

 

L'implémentation présentée supra propose une représentation de tous les éléments définis pour l'analyse sous la forme de prototypes. En particulier la sémantique d'une entrée lexicale est associée à un objet prototypique. La valeur sémantique attachée à cet objet est initialement définie de manière sous-déterminée : il convient ensuite de construire ou de définir les opérations qui permettent d'affiner cette valeur sémantique initiale. Dans notre approche, il s'agit donc de partir de représentations individuelles peu précises puis de fournir, dans un premier temps, les moyens pour affiner ces représentations. Ce travail s'appuie donc au départ sur des représentations conceptuelles individuelles : les objets prototypiques définis sont associés à des entrées lexicales données. Il semble raisonnable, dans un deuxième temps, de vouloir mettre un peu d'ordre dans les représentations adoptées ou tout au moins de vérifier s'il est possible de dégager des régularités dans les représentations ou dans les processus définis. On peut ainsi vouloir passer de représentations conceptuelles individuelles à des représentations conceptuelles plus générales. Peut-on construire, par induction, des représentations générales qui synthétisent les informations stables que l'analyse des séquences étudiées a permis de révéler, tout en conservant la possibilité de revenir sur cette stabilisation provisoire si des informations supplémentaires mettent en lumière des ajustements à opérer ?

 

La représentation par prototypes force à concevoir la représentation comme un processus perpétuellement à ajuster. La représentation pour le TALN doit s'attacher à proposer des modèles qui laissent ouvertes les représentations définies, dans la mesure où ce qui est représenté n'est jamais figé. Une représentation sous la forme de prototypes pour la mise en place d'une analyse automatique semble cohérente avec cette nécessité de représentation évolutive pour le TALN : les prototypes peuvent évoluer dynamiquement, il reste à évaluer les moyens qui réalisent cette évolution dynamique dans un analyse automatique du langage naturel.

6.3.1.1. Du méta-regard sur l'analyse à l'automodification des représentations

 

 

Un premier problème à résoudre est donc celui de la réorganisation des représentations initiales si l'analyse sur notre domaine restreint révèle des failles et donc des ajustements à opérer.

 

Un second problème à résoudre peut se poser de la manière suivante : tel type de comportement sémantique attaché à moulin se révèle être un comportement sémantique plus général pour une classe de noms plus large. Est-il possible de réorganiser cette part de savoir plus général? Comment effectuer cette réorganisation du savoir? Quel est l'impact d'une telle réorganisation sur les savoirs représentés? Il conviendrait pour cela de disposer de savoirs capables de détecter que tel comportement attaché à moulin se retrouve sous une forme assez proche dans la représentation sémantique attachée à un autre nom d'instrument. Puis d'étendre ce rapprochement de comportements partagés à un ensemble d'entités représentées. La difficulté ne s'arrête évidemment pas là, il s'agit ensuite de définir les modalités d'une réorganisation des savoirs partagés. La question de savoir si un tel aménagement est souhaitable n'est d'ailleurs pas à écarter : ne risque-t-on pas de définir des regroupements aléatoires dont la pertinence n'est pas justifiée? Il peut en effet y avoir des recoupements entre les comportements sémantiques de plusieurs classes de noms, il faut pouvoir y retrouver une cohérence à moins d'y perdre toute volonté de classer les choses "raisonnablement".

6.3.1.2. Comment définir des "démons" capables de redéfinir les comportements généraux à factoriser

 

 

Pour reprendre ce que nous disions au départ sur la (re)construction d'une représentation sémantique que l'on peut attacher à moulin, il s'agit aussi d'évaluer comment il serait possible d'étendre cette représentation sémantique aux noms d'instruments : comment mettre en oeuvre une catégorisation plus générale tout en préservant une évolution potentielle de cette représentation initiale? La représentation sémantique proposée dans la figure 2.25 tend à identifier (à isoler) les comportements sémantiques que l'on peut attacher à moulin et qui permettent de construire des (débuts d') interprétations qu'il reste possible d'affiner. Si ces comportements traduisent des opérations sémantiques plus générales qu'il est possible de factoriser pour une classe de noms particuliers (en particulier pour les noms d'instrument), il convient de restructurer l'organisation des représentations sémantiques attachées aux entités représentées pour disposer d'une représentation ouverte et cohérente du domaine visé. Si une approche prototypique se révèle adéquate pour rendre compte d'un micro-phénomène particulier, il convient de ne pas perdre de vue la place de ce micro-phénomène dans un système plus complexe, ou tout au moins de dégager de l'étude particulière de celui-ci, les éléments qui le dépassent. Si le TALN a du mal à classer l'ensemble des savoirs manipulés et leurs interactions, il convient de réfléchir à des processus qui organisent les savoirs et leurs interactions sur des domaines restreints en procédant par couches successives : dégager les strates "stables" et les comportements réguliers quitte à revenir sur ces choix si des éléments nouveaux viennent les mettre en doute.

6.3.2. Quels outils pour une évolution dynamique des représentations?

 

 

Le problème de toute forme de représentation pour un système de TALN se heurte à la difficulté de construire des méta-connaissances. Si l'on veut faire évoluer des objets représentés de manière sous-déterminée, il est possible d'ajuster le code de manière à répondre à ces évolutions de représentations. Une solution provisoire présentée précédemment redonnait la main à l'utilisateur pour qu'il modifie certaines valeurs sémantiques des entrées rencontrées si celles-ci ne permettaient pas de construire un composé en moulin à N2 satisfaisant pour le modèle défini. Ces ajustements restaient malgré tout limités aux représentations pré-définies : il était possible de modifier les valeurs des attributs des objets représentés mais ces ajustements ne permettaient pas de modifier les représentations construites. On peut ainsi vouloir que les représentations initialement construites puissent évoluer dynamiquement sans intervention directe de l'implémenteur dans les boites noires définies , ou sans intervention de l'utilisateur. Cette deuxième perspective consistait en fait à "forcer" une représentation pour qu'elle s'accorde avec un modèle préconstruit. Il ne s'agit donc pas de considérer le modèle initial comme un ensemble figé de représentations et de processus mais de permettre d'ajuster dynamiquement ce modèle (dans ses représentations et dans les processus qu'il définit).

 

L'exemple de la construction du sens des séquences en moulin à N2 illustre cette problématique. Dans la construction sémantique présentée supra, on part d'une représentation sémantique sous-déterminée pour une séquence en moulin à N2 qui peut être ajustée suivant la nature des composants de la séquence visée. Cet ajustement est malheureusement prédéterminé par le processus défini pour le calcul sémantique des composés étudiés. Le calcul sémantique permet d'ajuster les représentations et les valeurs attachées aux champs définis dans la limite fixée par ce calcul. Le corpus examiné a permis de construire un classement provisoire de séquences rencontrées. On a donc pu définir un filtrage dans l'implémentation du calcul sémantique défini qui s'accorde avec ce classement. Pour chaque séquence rencontrée dans notre corpus, l'analyse va produire au moins la réponse attendue. Il reste donc à définir les moyens pour ajuster les représentations et les processus de calcul pour éventuellement traiter des séquences qui n'entrent pas dans le modèle sous-jacent aux filtres sémantiques construits.

 

Le modèle pour la construction du sens esquissé ici construit par défaut une interprétation sous déterminée. Si une séquence donnée ne vérifie pas les filtres qui permettent de préciser cette interprétation "prototypique", c'est la solution "minimale" qui sera proposée. A partir de là, on peut vouloir :

 

• 1. Soit ajuster la solution fournie, c'est-à-dire disposer de règles sémantiques (de processus informatiques) qui permettent ces ajustements (qui les réalisent).

 

• 2. Soit modifier le modèle défini pour prendre en compte cette nouvelle réalisation d'autant plus si cette solution se révèle pertinente pour d'autres séquences. Cette approche revient à établir un nouveau classement au sein de notre modèle.

 

Le premier point semble délicat à envisager d'un point de vue dynamique. Il semble en effet difficile de définir, puis d'utiliser une nouvelle règle sans passer, au préalable, par une analyse linguistique. A moins de disposer d'une somme considérable de méta-connaissances sur la langue, il ne semble pas possible de pouvoir mettre à jour dynamiquement cette base de savoirs sémantiques représentées par les règles définies. Il semble plus raisonnable de travailler sur un modèle qui accepte de manière peu coûteuse des ajustements dans la base de savoirs qu'il manipule.

 

6.4. De la linguistique à l'informatique : retour sur un examen des besoins propres à la représentation des connaissances pour le TALN

6.4.1. Paradigmes courants en TALN et environnements informatiques

 

 

En examinant quelques uns des posés et présupposés de la sémantique différentielle et ceux couramment mis en oeuvre dans les travaux actuels en TALN, on mesure les tensions qui peuvent exister entre ces deux approches.

6.4.1.1. Posés et présupposés dans les travaux courants actuels en TALN

 

 

Une large famille de traitements automatiques actuels se sont développés sur la base des formalismes d'unification. Les présupposés de ces formalismes sont nombreux :

 

• 1. La détermination du local sur le global.

 

Le principe de projection lexicale à partir des têtes lexicales est central. Il peut mener jusqu'à des grammaires entièrement lexicalisées dans lesquelles des règles non lexicalisées sont difficilement pensables. Dans les formalismes d'unification les traits sont utilisés de facon essentialiste, à la manière de primitives sémantiques. Les entrées lexicales sont créées indépendamment de considérations de genres et de domaines, ce qui conduit en général à des traitements homonymiques, sans prendre en compte le fait qu'une partie des ambiguïtés est artificielle, dans la mesure où elle naît de la réunion de significations qui ne se réalisent pas dans les mêmes textes.

 

• 2. La primauté en fait, voire en droit, de la syntaxe.

 

• 3. L'horizon indépassé de la phrase.

 

• 4. La visée compositionnelle et la construction en parallèle de représentations syntaxiques et sémantiques.

 

Les formalismes d'unification se veulent monotones. L'usage des défauts est reservé a la représentation du lexique, mais n'intervient pas au cours de l'analyse.

 

• 5. La langue et non les textes.

6.4.1.2. Représentation par Objets et TALN : la PàO et la PàP

 

 

Les travaux menés en TALN ont longtemps privilégié les modèles de représentation fondées sur les taxonomies de classes. Les domaines de savoir où la catégorisation est mouvante (non figée) ne peuvent malheureusement pas se contenter de mode apriorique de représentation (les taxonomies de classes). La construction du sens met en avant la nécessité de disposer de mode de représentation inductif (à l'image des prototypes) capable de faire évoluer les structures de représentation construites.

6.4.2. La sémantique différentielle bouscule les paradigmes courants du TALN : problèmes théoriques et implications pour une mise en oeuvre informatique

6.4.2.1. Posés et présupposés de la sémantique différentielle

 

 

Dans l'approche sémantique suivie par Rastier, c'est le global (i.e. les textes) qui détermine le local. Un mot ne se définit pas par rapport à des états de chose ou à des états mentaux mais par rapport à ses contextes : un mot (occurrence) ne se définit que dans et par un contexte et reçoit des déterminations par le texte. Le sens d'un mot ne lui est donc pas permanent, il est toujours le produit d'une interprétation fondée ou non sur des inférences par défaut qui héritent ou non de la sémantique d'un type lexical préconstruit et si le sens résulte d'une interprétation, il convient pour en rendre compte de décrire au mieux les parcours interprétatifs et les contraintes linguistiques sur ces parcours. De fait, placer les mots sous l'autorité d'un type revient à les décontextualiser et à les détextualiser et le rapport du type à l'occurrence s'éclaire si l'on considère que les types ne préexistent pas aux occurrences mais sont reconstruits à partir d'elles (Rastier 1995).

 

La sémantique différentielle met au centre de sa démarche les textes (et non le signe) et les genres, discours et pratiques sociales qui les régissent. Dans cette démarche les significations ne sont pas définies par référence à des choses, mais par des relations au sein de classes lexicales dans un corpus donné, la définition compositionnelle du sens, tout comme la notion d'un sens premier, modifié par le contexte, s'avèrent invalides. En fait c'est le contexte global (le genre du texte, ses conditions de production) qui conduit à l'interprétation des signes : "l'interprétation ne s'appuie pas sur des signes déjà donnés, elle reconstitue les signes en identifiant leurs signifiants et en leur associant des signifiés. L'identification des signes comme tels résulte donc de parcours interprétatifs" (Rastier in (Rastier & al. 1994)). Ces parcours interprétatifs remanient dynamiquement les ensembles de sèmes associés aux données textuelles, actualisant certains, virtualisant d'autres. Cette approche renverse la conception la plus courante de la référence : "Alors que la tradition métaphysique occidentale en philosophie du langage pose que les mots ont une signification parce que les choses ont un Etre /.../, nous concluons à l'inverse que les choses nous paraissent douées de qualités substantielles comme l'identité à soi dès lors qu'elles sont réifiées par les processus de référenciation. /.../ En d'autres termes, les "objets" nous sont acquis au sein de pratiques, et non par une saillance physique qui nous les imposerait; la référence va donc des mots aux choses, isolées et specifiées par leur sémiotisation, qui est un processus hautement culturel" (Rastier in (Rastier & al. 1994)).

 

Nous reprenons ci-dessous les points principaux qui fondent la problématique de la sémantique différentielle et qui, en regard de ce qui a été dit sur les supposés des formalismes d'unification, éclairent les écarts théoriques entre les deux approches.

 

• 1. Primauté du global sur le local.

 

Dans cette approche, il faut "admettre l'incidence déterminante du palier textuel sur les paliers inférieurs" (Rastier in (Rastier & al. 1994)). En simplifiant on peut dire que l'ambiguïté dans une situation de communication donnée n'existe pas : il n'y a en général que de la polysémie artificielle, la mise en contexte des signes linguistiques lève toute ambiguïté potentiellemment active sur les signes hors contexte. Dans le cadre des prototypes, on peut envisager de mettre en place cette incidence du global sur le local sous la forme de processus qui agissent sur les entités de bas niveau représentées en ajustant les structures de ces entités suivant les nécessités rencontrées.

 

• 2. Remise en cause de la syntaxe.

 

"Quand /./ l'ordre syntaxique domine l'ordre herméneutique, l'identification des signes est considérée comme allant de soi : il suffirait de leur appliquer les règles syntaxiques pour procéder ensuite à leur interprétation. Ce n'est pas si simple, car les conditions de l'identification des signes et du choix des règles ne résident pas dans le texte, mais dans la situation où il est produit et interprété" (Rastier in (Rastier & al. 1994)). De plus, Rastier indique qu'"en pratique beaucoup d'applications n'exigent pas d'analyse syntaxique préalable" (Rastier in (Rastier & al. 1994)). Malgré tout, l'absence de précision sur des réalisations, concrètes et de grande ampleur, de systèmes dans une telle approche empêche de savoir si la sémantique différentielle pourrait réellement se passer d'une analyse syntaxique préalable.

 

• 3. Dépasser les cadres syntaxiques traditionnels.

 

Les domaines pour la sémantique ne correspondent pas aux constituants de la syntaxe. "Toute "barrière" syntaxique inhibe les relations sémantiques contextuelles" (Rastier in (Rastier & al. 1994)). Et même si le syntagme demeure, "l'intégration du syntagme résulte des relations de concordance et de rection qui s'y établissent. Elle ne doit pas être confondue avec une composition, ni même une combinaison". La phrase (pleine de ronces syntaxiques) est remplacée par la période. Cependant, la critique de la conception hiérarchique de la phrase qui oublie les relations diagonales et les attachements multiples doit être précisée.

 

• 4. Une dynamique de l'interprétation.

 

"La sémantique différentielle est dynamique/./; au cours de l'interprétation, le contenu lexical est susceptible de diverses tranformations à l'intérieur des sémèmes eux-mêmes, parallèlement à l'utilisation de ce contenu pour la construction de structures interprétatives comme les isotopies et les molécules sémiques" (Rastier in (Rastier & al. 1994)). On retrouve avec la sémantique différentielle l'idée que le sens n'est pas une donnée : "Les signes linguistiques ne sont que le support de l'interprétation, ils n'en sont pas l'objet. Seuls les signifiants, sons ou caractères, sont transmis : tout le reste est à reconstruire" (Rastier in (Rastier & al. 1994)). Aucune énumération, aucune décomposition des unités qui composent un énoncé ne peut donner une somme de sens correspondante : "Le principe de compositionnalité est invalide en sémantique linguistique et /./ l'interprétation échappe ainsi de droit au paradigme du calcul /./" (Rastier in (Rastier & al. 1994)). Chaque texte donne lieu à la construction d'un ensemble de mondes. L'interprétation consiste généralement à décrire les inférences qui permettent de passer de la linéarité du texte à une compréhension plus précise : le découpage du texte, l'inventaire et l'articulation des relations entre mondes jouent un rôle essentiel pour exprimer un des sens possibles du texte visé : "Le sens d'un texte ne lui est pas immanent, il est immanent à la situation de communication à laquelle appartient le texte. Il varie donc avec les paramètres de cette situation" (Rastier in (Rastier & al. 1994)). Comme on l'a déjà vu avec moulin, les mécanismes à l'oeuvre dans la construction du sens peuvent faire évoluer les savoirs et modifier leurs valeurs : "Si l'on définit les significations non par référence à des choses, mais pas leurs interrelations au sein de classes lexicales, les significations se modifient quand les classes changent : ainsi la définition de 'métro' a changé quand au sein de la classe des transports collectifs urbains est apparu 'RER'; et cependant le métro lui-même ne changeait pas. En outre, les discours remanient sans cesse les classes lexicales, qui ne sont fixées que par des normes révisables; et par là il modifie la signification des mots" (Rastier in (Rastier & al. 1994)).

 

Représentation du lexique.

Si la langue est une matière organique, si ces composants évoluent individuellement ou dans leurs interrelations, il est illusoire de tenir leur classement ou leur représentation comme définitifs et figés :"Le lexique d'une langue n'est pas une nomenclature qui quadrillerait uniformément une réalité supposée. En outre, il ne se laisse pas organiser en taxonomies arborescentes (sauf précisément les parties du lexique structurées par de disciplines comme la zoologie)" (Rastier in (Rastier & al. 1994)). Les savoirs que l'on peut associer aux mots peuvent être remis en question, le sens des mots peut être altéré ou modifié dans des situations particulières. De plus les savoirs établis à un moment donné peuvent évoluer et être étendus quand de nouvelles activités, de nouveaux comportements, de nouveaux outils... sont créés.

 

• 5. Les textes et non la langue.

 

La sémantique différentielle met en avant le travail sur le rôle des textes comme objet de la linguistique (en lieu et place des langues), comme points de départ des parcours interprétatifs; elle met aussi en avant la médiation des genres. On est donc très loin de la tradition courante du TALN qui consiste à travailler sur la grammaire et le lexique d'une langue donnée : "Une langue n'est pas composée d'un et d'un seul système, mais de plusieurs instances régulatrices en interaction constante, et qui évoluent selon des temporalités différenciées" (Rastier in (Rastier & al. 1994)).

6.4.2.2. Quels outils informatiques pour la sémantique différentielle ?

 

 

"Les théories linguistiques qui ont la meilleure capacité descriptive ne sont pas nécessairement celles qui se prêtent le mieux à la mise en oeuvre informatique, dont les conditions sont au demeurant contingentes (état de l'art, habitudes de pensée, etc..)" ((Rastier in (Rastier & al. 1994))).

 

Quels devraient être les environnements informatiques dont il faudrait disposer pour la sémantique différentielle? La place du travail sur corpus suppose de préciser les outils d'exploration et de structuration de ces corpus qui s'avèrent nécessaires. Quels sont d'ailleurs les paradigmes informatiques qui permettent de rendre compte clairement de phénomènes tels que :

 

• L'articulation du quantitatif et du symbolique.

 

• La négociation entre informations de différentes natures et de différents niveaux.

 

• L'organisation hiérarchique/hétérarchique des mécanismes d'analyse à employer.

 

• La place de la non-monotonie (le poids du global peut amener à virtualiser certains traits inhérents).

6.4.3. Prototypie (au sens de la PàP) et sémantique différentielle

 

 

On rappelle que notre travail vise à interroger les formalismes informatiques disponibles (en particulier ceux qui tournent autour de la représentation par Objet) afin de déterminer si ces formalismes répondent clairement aux exigences impératives que nos choix dans les traditions linguistiques imposent pour la construction du sens : quitte à envisager une articulation de ces formalismes si ceux-ci se révèlent cohérents pour résoudre certains phénomènes particuliers (on peut par exemple organiser les savoirs stabilisés dans un mode de représentation hiérarchique (via une approche Objet (Instance de Classe)), et les savoirs flous dans un mode de représentation inductif (via une approche Objet (Prototype)).

 

La représentation pour le TALN doit s'attacher à proposer des modèles qui laissent ouvertes les représentations définies, dans la mesure où ce qui est représenté n'est jamais figé. Une représentation sous la forme de prototypes pour la mise en place d'une analyse automatique semble cohérente avec cette nécessité de représentation évolutive pour le TALN : si les prototypes peuvent évoluer dynamiquement, la notion d''"évolution dynamique" propre aux prototypes s'accorde-t-elle avec la dynamique de l'interprétation que la sémantique différentielle met en avant?

 

 

(In)Adéquation entre le paradigme "Représentation par Prototype" et les besoins propres à la sémantique différentielle ?

 

 

Nous limiterons nos remarques aux points qui cristallisent les tensions exprimées précédemment.

 

• 1. Sur notre domaine restreint des séquences en moulin à N2, c'est la syntaxe qui guide la construction sémantique des composés.

 

• 2. Les représentations lexico-sémantiques adoptées restent encore peu précises tout en maintenant une définition sémantique essentialiste à la manière des formalismes d'unification. Sur ce point, il convient de repréciser que le développement de notre travail est encore loin des exigences que nous souhaitons mettre en oeuvre et notamment dans la représentation lexico-sémantique des éléments manipulés. Notre travail vise à la mise en oeuvre de processus dynamiques qui agissent au cours de la construction du sens sur les représentations définies : ce travail vise donc à considérer l'interprétation comme une reconstruction du sens à partir des éléments présents dans la séquence linguistique donnée en tenant compte des conditions de production de cette séquence; il ne s'agit pas donc pas de réaliser un simple calcul qui combine les valeurs sémantiques individuelles pour produire un résultat global.

 

• 3. L'état actuel de notre travail sur la construction du sens des séquences en moulin à N2 peut être assimilée à une vision compositionnelle de la construction du sens. Ce sont les valeurs locales des composants qui déterminent les valeurs globables des composés. Nous avons déjà mentionné supra que nous envisagions la nécessité de pouvoir fournir des informations qui dépassent le cadre du composé et qui permettent d'ajuster la construction sémantique visée si nécessaire; soit en récupérant des contraintes sémantiques liées au développement de l'analyse, soit en tenant compte des contraintes générales que les textes (contenant ce type de séquences) révèlent (genre ou domaine d'un texte pour reprendre les termes de Rastier) : ce travail reste à faire. Dans le cadre particulier étudié ici, il semble possible de faire coïncider en parallèle une détermination du local sur le global et une détermination du global sur le local. L'absence (provisoire) de telles contraintes globales sur la production des séquences analysées force pour le moment l'analyse à donner plus de poids aux informations sémantiques locales (en particulier celles attachées au N2 dans le composé) et donc à orienter l'analyse vers une version compositionnelle : il ne s'agit en tout cas pas d'un choix théorique. Encore une fois nous souhaitons à terme pouvoir confronter les informations sémantiques disponibles, ainsi que contraindre les opérations que le global impose sur le local et réciproquement. Cette dernière exigence pose d'ailleurs le problème de savoir de quelle manière représenter les contraintes globales sur un texte dans un formalisme qui manipule des prototypes. Cette question reste ouverte.

 

• 4. Une première approche pour mettre en oeuvre des contraintes globales sur la construction du sens des séquences en moulin à N2 passe à coup sûr par une étude précise des conditions de réalisation des séquences visées. Et donc à un retour sur une analyse plus précise de notre corpus : en particulier pour y mettre en lumière les éléments sémantiques (extérieures à la séquence) qui agissent sur l'interprétation des séquences en moulin à N2. Là encore ce sont les besoins linguistiques qui doivent interroger les outils disponibles pour déterminer si ces derniers peuvent répondre clairement à ces besoins : si des contraintes linguistiques globales permettent de résoudre l'interprétation de certaines séquences, il reste à définir les mécanismes qui permettent d'ajuster les structures de représentation construites pour rendre compte de ce genre de phénomène.

 

• 5. De la même manière que Rastier définit les significations par les interrelations au sein de classes lexicales, la notion de prototype, telle que nous l'utilisons, permet de définir les significations des prototypes manipulés par un jeu de relations qu'il est possible de construire sur les comportements que l'on peut attacher à ces prototypes : les prototypes sont ce qu'ils font i.e. ils se différencient par leurs comportements. On peut ainsi concevoir l'interprétation comme l'activation potentielle de comportements particuliers : ces comportements sémantiques n'étant pas le reflet d'une norme sémantique, mais un état particulier qu'il reste possible d'ajuster, d'ordonner, de réifier... suivant les conditions rencontrées.

 

• 6. La notion de comportement semble rejoindre la volonté de Rastier de mettre en avant le travail sur le rôle des textes en lieu et place de la langue. Il semble en effet assez clair de parler de comportements contextuels particuliers lorsqu'on parle d'unités de langue alors que vouloir définir un comportement général pour les mêmes unités peut vite devenir une illusion.

 

 

6.5. Conclusion et perspectives

 

 

• Dans cette première partie de notre travail, nous avons étudié des séquences nominales du type moulin à N2 dont l'interprétation est principalement déterminée par le local (i.e. les composants de ces séquences) : ce sont les valeurs locales des composants qui déterminent les valeurs globables des composés étudiés. Cependant dans le cadre particulier étudié ici, il semble possible de faire converger une détermination du local sur le global et une détermination du global sur le local. L'absence (provisoire) de telles contraintes globales sur la production des séquences analysées force pour le moment l'analyse à donner plus de poids aux informations sémantiques locales (en particulier celles attachées au N2 dans le composé) et donc à orienter l'analyse dans une version compositionnelle. Les savoirs lexicaux représentés étant ajustables dynamiquement, il reste possible d'affiner ces interprétations si des processus décrivant le rôle des textes sur ce type de séquence sont disponibles : soit en récupérant des contraintes sémantiques liées au développement de l'analyse, soit en tenant compte des contraintes générales disponibles ou à venir. Ce dernier point n'est pas traité dans cette première phase de notre travail mais la question reste ouverte. Nous souhaitons à terme pouvoir confronter les informations sémantiques disponibles en tenant compte en particulier des opérations que le global impose sur le local et réciproquement.

 

• Par la suite, on travaille sur des savoirs extraits à partir de corpus. Notre travail va se poursuivre en intégrant cette nécessité de travailler sur des réalisations textuelles pour y dégager les comportements particuliers à l'oeuvre. Les savoirs linguistiques prennent leurs réelles dimensions dans leur mise en action au sein de discours. Leur représentation passe donc par un examen plus précis de leurs réalisations.