PARTIE ELIZIA

      DEVOIR N°7



CORDIAL : "Cordial est un logiciel de correction grammaticale et d'aide à la rédaction pour la langue française  pour Microsoft Windows."

1°) Choix d'un texte :


Avantages du logiciel :


- Cordial peut nous donner le thème principal du corpus, ainsi que les mots forts qu'il a pu identifier .



- Le logiciel permet de donner les synonymes : on clique sur l'icône "affiche les synonymes du mot sous le curseur" et le logiciel nous donne des synonymes du mot.


- Le logiciel peut nous donner des mots analogues au mot placé sous le curseur. En effet ici, pour "elle", le logiciel nous donne quelques mots analogues qui pourraient remplacer le terme de départ


- Le logiciel peut aussi nous donner les types grammaticaux, en effet lorque l'on clique sur l'icône "afficher la description grammaticale du mot sous le curseur" puis que l'on place le curseur sur le mot, le logiciel nous donne le type de mot (genre/ nombre/ catégorie syntaxique).

- Le logiciel permet une correction syntaxique du texte : par exemple ici j'ai placé un "pas" (de négation dans le texte), le logiciel a trouvé une erreure et l'a corrigé en bas de la page. Il a trouvé qu'il fallait rajouter "ne" pour former correctement la négation "ne...pas", et rendre la phrase syntaxiquement correcte.


- Le logiciel peut également étudier la structure du texte et repérer les erreurs de ponctuation, ici erreur de ponctuation "oublie d'un espace avant le point virgule".


- Le logiciel peut effectuer des statistiques sur le texte, par exemple : calculer le nombre de caractères avec ou sans espace, le nombre de phrases, de mots, de paragraphes. Il peut également effectuer des calculs au niveau de la grammaire du texte, par exemple : le pourcentage d'articles, d'adjectifs, les pronoms.

       

- En cliquant sur l'icône "sémantique", divers choix s'offrent à nous, on peut connaître les mots clés sélectionnés par Cordial, mais également les mots "délaissés", classés par ordre d'importance.

     

Désavantages du logiciel :


- Dans ce texte, j'ai inséré quelques erreurs orthographiques, mais le logiciel ne les a pas trouvé, il n'a pas fait de remarque.

- Ce logiciel (ayant déjà quelques années) ne connaît pas certains mots, ou leur nouvelle fonction ou leur sens.


2°) Testez les deux outils de Traduction automatique avec un corpus :

GOOGLE Translate


SYSTRAN


- Traduction du texte par google


- Traduction du texte par systran



Pourquoi peut-on parler "vers un schéma général" ?

"La structure d'une phrase n'est bien entendu pas un universel linguistique, et la possibilité de traduction se situe à un niveau bien plus profond que l'ordre des mots." En effet la traduction d'un texte n'est pas seulement l'ordre des mots, c'est à dire transcrire un texte en mettant les mots les uns à la suite des autres. Il faut passer par tout un processus. Le logiciel traite d'abord la syntaxe de la phrase (en étiquettant les phrases et en faisant un arbre syntaxique) puis il fait une analyse sémantique pour donner un sens à la phrase (après avoir analyser ses constituants), enfin la machine donne la traduction de la phrase demandée. Tous les logiciels de traduction ont le même "schéma général" pour traduire un texte.

La machine doit avoir des connaissances sur les langues à traduire, mais aussi sur des connaissances générales, et sur les processus syntaxiques.

Dans les deux exemples, Google Translate et Systran ont tous les deux donnés des traductions de mon texte en français vers l'anglais. On remarque que certains mots n'ont pas été traduit de la même façon. Mais dans les deux cas, ils ont analysé le texte de départ et on fait une analyse syntaxique, lui ont donné un sens et ils ont traduit le texte en fonction de ce sens.


3°) Testez MOTBIS, Qu’est-ce c'est un thésaurus? Comment ça marche ?


- Test du logiciel pour le mot-clef "linguistique"


      
- Autres exemples de Thésaurus

 


Qu'est ce qu'un thésaurus ?

"Un thésaurus est une liste organisée de termes représentant les concepts d'un domaine de la connaissance. C'est un langage contrôlé utilisé pour l'indexation et la recherche de ressources documentaires dans des applications informatiques spécialisées. Les thésaurus sont donc une catégorie de langages documentaires parmi d'autres." (Source Wikipédia)

Comment fonctionne-t-il ?

Le logiciel demande un "mot-clef" par exemple "linguistique", il va nous donner une liste "prématurée" qui permet de recher dans quel contexte on recherche le mot (en politique, sciences, en syntaxe...). Après avoir choisi le contexte, le logiciel nous donne "environnement sémantique direct" du mot-clef. Il apparait alors un schéma avec au centre le mot-clef choisi dans son contexte, en haut "le terme générique", en bas le ou les "termes spécifiques", à droite les "termes qui peuvent lui être associés" et enfin à gauche "employé pour". Donc ce logiciel permet de donner une liste de mots en rapport avec le mot clef rechercher, et en donner toutes les ressources documentaires.


"Une petite introduction au Traitement Automatique des Langues Naturelles"

Télécharger le compte rendu

Retourner en haut de la page

  Devoir précédent                                                                                                                             Elizia