NETOYAGE :
Dans cette partie et pour un soucis de compatibilité des fichiers pour l'étape suivante, à savoir; la recherche de patrons morphosyntaxique. On a effectue un petit netoyage des fichiers résultat du Taggage, en enlevant les balises <w> </w>. en fesant en sorte d'obtenir un fichier bien aligné ( mettre les résultat ligne par ligne). et ce toujours pour ne pas avoir de problèmes lors de la recherche des patrons.
Le programme utilisé : Filtre.pl
TABLEAU DES RESULTATS :
Après et pour des raison de foctionnement, et de vitesse d'execution des programme a venir, notamment le programme d'extraction terminologique. qu'on a essayé de faire tourné avec les fichier entier mais, le programme ne repondais pas ( il ne s'arretait pas de tourner) même après plusieurs heures d'execution.
On a donc selectionné les 8000 premières lignes de chaque fichier. et ca a donner les resultats suivants: