Accueil
index sommaire partie1 partie2 devoir3

 devoir4 partiel  partie3














       les différents devoirs faits au cours de l'initiation au TAL

   

Introduction au Traitement Automatique du Langage

 

LZO15 Devoir n°2

 

Question 1

Le chatbot est un logiciel informatique permettant de communiquer en temps réel avec un locuteur fictif. Il s’avère être utile et ludique mais dans un cadre restreint car il y a des limites à ce système. En effet, on ne peut pas discuter sur des sujets précis étant donné qu’Elizia n’est pas programmé pour cela.

 

Question 2

Avec la recherche, un logiciel tel que celui-ci devrait tout d’abord pouvoir répondre à toutes sortes de sujet vastes comme précis. Pour cela, il faudrait mettre à sa disposition un dictionnaire ou ensemble de données de manière à ce qu’il puisse s’adapter à n’importe quel locuteur.

Le second problème qu’il est urgent de résoudre est l’orthographe. La seule solution à laquelle je pense, serait de réévaluer entièrement le recueil de données afin d’éliminer les fautes d’orthographe.

Enfin, il serait également nécessaire d’adapter ce logiciel pour les internautes étrangers en intégrant notamment l’anglais, l’allemand, l’espagnol … sans oublier le chinois qui est en fort progression dans le monde actuel.

 

Question 3

Après avoir amélioré le système, les qualités d’Elizia pourraient être en adéquation avec celles qui permettraient à un système de passer le test de Turing.

Malheureusement, si Elizia était confronté au test de Turing sans avoir était modifiée, l’homme à l’aveugle discernerait l’ordinateur de l’autre être humain car les faiblesses sont encore trop visibles.

 

Question 4

Les critères que j’envisagerai pour un chatbot seraient :

 -la syntaxe : chercher à savoir si les phrases sont correctement construites.

 - la sémantique : voir si l’on comprend le sens des réponses que le logiciel informatique produit.

 - la diversité dans le vocabulaire : afin qu’il y est peu de répétitions.

 

Question 5

Mes questions

Les réponses d’Elizia

L’évaluation de ses

réponses

bonjour ! Commet allez-vous ?

Je vous souhaite la bienvenue à cette session de thérapie !

TB

 j'ai besoin de votre aide !

Êtes-vous sûr (/e) que vos souhaits correspondent à vos besoins ?

Nul

 j'ai peur de l'anesthésie. Et je voudrais que vous m'expliquiez ce que c'est.

Êtes-vous sûr (/e) que vos souhaits correspondent à vos besoins ?

Nul

qu'est-ce qu'une anesthésie générale ?

Avez-vous posé la question à une autre personne?

Nul

sinon quel temps fera-t-il demain ?

Qui a dit 'Il n'est rien de plus précieux que le temps, puisque c'est le prix de l'éternité.' ?

Nul

le soleil est-il bon pour le moral ?

Vous avez le teint pâle, vous avez besoin d'un bon bol d'air.

Nul

merci pour votre aide même si elle n'est pas très fructueuse. A bientôt !

Parlons plutôt de vous.

Nul

Après avoir isolé les tours de paroles, on s’aperçoit qu’il n’y a aucune cohérence entre les questions et les réponses. Si dans cet exemple, il n’y a pas de fautes d’orthographe, on remarque tout de même des répétitions (cf. lignes 2 et 3 du tableau) alors que les questions sont différentes.

De plus, on peut remarquer que le critère syntaxique est rempli car aucune phrase n’est agrammaticale. Cependant, la sémantique n’est pas respectée puisqu’on n’observe aucun lien de sens au sein de cet échange.

Question 6

Pour éviter les répétitions, il faut développer davantage l’inventaire des données et des capacités du logiciel afin qu’il puisse utiliser des synonymes …

Cette multiplication de mots permettra donc de fluidifier et d’enrichir les réponses d’Elizia. Il y aura ainsi un lien et un fil directeur au sein de la conversation qui répondra au critère sémantique.

Question 7

En effet, il existe un déclencheur pour la répétition dans l’onglet supervision du chatbot Elizia.

Nous pouvons nous même le modifier en tant que personne « étrangère » à la création de ce logiciel informatique.

Question 8

Le rôle de Traitement Automatique du Langage est de traiter toutes formes de langages de façon technique et informatique.Notamment avec l’utilisation de logiciels informatisés mais également de disciplines comme la linguistique…

Le mot clé est un terme général ou générique regroupant plusieurs autres mots ayant un sens commun ou une racine commune. Lorsque deux mots clés sont valables pour le même cas, l’utilisation de l’un ou de l’autre est tolérée mais à condition que le sens soit commun à l’ensemble de cette classification. 

Question 9

La syntaxe est une science qui étudie les constituants permettant de former une phrase. La nature et la fonction de ces éléments sont essentielles à la compréhension globale d’une phrase ou d’un énoncé. L’analyse morphosyntaxique mêle donc le mot et la syntaxe et elle utilisée pour l’étude d’un corpus. La formation d’un mot et son sens permettent une meilleure compréhension lorsqu’ils sont respectés.

 

Question 10

On peut détecter le sens clé d’une question lorsqu’ il y a tout d’abord un verbe à l’infinitif comme dans l’exemple suivant :

-         Pourriez-vous m’aider s’il vous plaît ?

Le verbe « aider » donne tout son sens à cette question. Il facilite donc la compréhension du sens global.

En revanche, il est plus difficile de le trouver dans un exemple comme celui-ci : Tu rentres tard ce soir ?

Mais c’est un cas plus rare.

Enfin les adverbes interrogatifs sont porteurs de sens et permettent aux interlocuteurs de comprendre immédiatement la question :

-         Où vas-tu ?

-         Comment allez-vous ?

-         Quand est-ce que vous vous êtes rencontrés ?

-          …


Question 11

On peut cerner une bonne discussion lorsque la syntaxe et la morphologie sont respectées. Mais également lorsque la ponctuation a été correctement utilisée car elle facilita l’accès au sens. Enfin, une sémantique riche permet également d’éviter les répétitions et d’avoir un dialogue plus fluide.

 

Question 12

Dans l’interface Elizia, on peut afficher :

-         les cas reconnus dans l’historique en utilisant « ::: » afin d’obtenir des étiquettes.

-     Une liste en ordre alphabétique de tous les mots qu’Elizia teste contre les mots clés, en utilisant « all : ».

Voici un exemple :

-         Les lemmes en utilisant « lemmas : ».

 

-         Les mots, en utilisant « words : ».


 

Question 13

On peut servir les fonctionnalités mentionnées dans la question précédente pour étudier les capacités propre à cette interface en termes de sémantique et taxinomie (classification de mots partant du général au particulier.) Elles permettent également d’apprécier l’éventail de mots qu’utilise Elizia.

Question 14

Après avoir été dans l’onglet supervision de l’interface, je vais modifier les cas normaux afin de voir si il y a des changements ou non.

Le premier cas reconnu modifier, est celui qui s’intitule « mon identité ». J’ai décoché la case « ce cas peut être repris ».

 

Conséquences : Elizia ne répond plus de manière ordonnée et répétitive ; mais plutôt de façon aléatoire.

Ensuite, je me suis concentrée sur la rubrique « insultes », en modifiant la supervision.

 

 

D’après l’image ci-dessus, la conversation devrait donc s’arrêter immédiatement après qu’une insulte ait été formulée.

 

Malheureusement, nous pouvons nous apercevoir que la conversation ne s’interrompt pas. Cet interface n’a donc pas aboutit à une parfaite efficacité.

Question 15

Un des cas d’étude possible que je proposerai serait celui de l’orthographe. En effet, lorsque l’on étudie la supervision d’Elizia, on remarque que de nombreux mots on été accepté avec des fautes d’orthographe. Ce qui explique que nous rencontrons, dans certains échanges, des mots mal orthographiés.

L’autre cas d’étude qu’il serait intéressant de traiter est celui de l’inventaire, des possibilités de réponses d’Elizia, trop restreints à mon goût. Pour cela, il faudrait enrichir les réponses d’Elizia afin d’obtenir des conversations plus passionnantes et plus précises sur certains sujets.