Segmentation, étiquetage et analyse syntaxique
Phase 2 : étiquetage
1. Etiquetage de phrases
1.1. Définir les tâches à réaliser
Segmenter en mots
Etiqueter les mots : lecture d'un dictionnaire catégorisé
(à créer)
Réécrire les phrases étiquetées
1.2. Expérimentation
1.2.1. Etiquetage de phrases
Créer en Perl un programme pour étiqueter les phrases
suivantes :
La petite brise la glace
La belle ferme la porte
Les résultats construits sont à réécrire
dans un fichier. Utiliser un format qui pourrait avoir l'allure suivante
:
-
Chaque noeud du graphe est représenté par un numéro.
Le noeud 1 est toujours le noeud contenant le séparateur de début
de phrase. La première ligne du fichier contient le nombre de noeuds
du graphe. Les lignes suivantes contiennent les description des noeuds.
-
La description d'un noeud comprend le numéro du noeud suivi par
le mot ou le séparateur contenu dans ce noeud, suivi par la catégorie
attachée, suivi par les informations supplémentaires sur
le mot (genre,personne,nombre,temps), et suivi enfin par la liste des noeuds
fils terminée par 0.
-
Par exemple le fichier associée à la phrase "Le vent souffle."
aura le format suivant :