Accueil | Elizia | Problèmes | Améliorations | PC PATR |

Introduction à PC PATR

PC PATR est un parseur, c'est-à-dire un logiciel qui est capable de découper une phrase en fonction des différentes unités qui la composent.  Ce logiciel a été devéloppé dans le cadre du Summer Institut of Linguistics de Dallas, TX aux Etats-Unis.  Nous travaillons sur PC PATR au moyen d'un interface comme vous voyez dans l'image ci-dessous:
PC PATR interface
Une fois l'interface ouvert, il faut charger un lexique et une grammaire prédéfinis, qui contiennent des données à partir desquelles le programme construit ses arbres.  La grammaire contient des règles sur la formation d'une phrase en syntagmes, ainsi que les règles qui définissent le contenu des syntagmes.  Le lexique contient une liste de mots et des informations syntaxiques sur chaque mot, ce qui permet au programme de discerner la structure de chaque phrase. Pour charger le lexique il suffit de taper l_l_lexique et pour la grammaire, l_g_grammaire  (ici les _ dénotent les espaces).  Une fois ces documents chargés, il faut taper la commande parse et puis entrer une phrase. Par exemple, si vous entrez une phrase comme "Le chat craint le loup", vous aurez le résultat suivant:

arbre syntaxique
Il est aussi possible d'augmenter les bases de données, le lexique et la grammaire, avec un éditeur tel que Notepad ++.  Ainsi le parseur serait capable d'analyser plus des phrases, avec une structure plus compliquée ou avec des mots qui ne se trouvaient pas dans le lexique avant.  Le parseur peut aussi reconnaitre des phrases agrammaticales.  Dans ce cas, comme si vous entrez, par exemple, une phrase comme "chat le craint loup", vous aurez la réponse ****cannot parse this sentence****, ce qui veut dire qu'il est impossible d'analyser cette phrase, elle ne correspond pas aux règles définies dans la grammaire.

Pour voir un peu ce que nous avons essayé de faire avec ce parseur, cliquez ici...