Projet Multilingue - v.1.0

Partie Traitement 1

Page Précédente Page Suivante

Passons à présent à la partie traitement.
Le traitement consiste, comme dit précédemment, à rechercher les expressions du conseil dans un texte et, pour cela, nous avons décidé de relever toutes les formes du conseil dans notre corpus de référence.
Voici donc les formes du conseil relevées dans les pages en anglais : anglais.txt
Et voici donc les formes du conseil relevées dans les pages en japonais : japonais.txt

Ces formes sont étudiées et normalisées afin d'obtenir le segment répété le plus significatif dans le cas du japonais et afin d'obtenir un traitement indépendant de la casse pour l'anglais.

A partir de ces formes que nous avons notées, nous voulons un outil qui nous permette l'affichage d'un concordancier de la forme recherchée ainsi que de la phrase correspondante dans l'autre langue. Cet outil permettrait donc de faire une recherche des expressions du conseil indépendemment de la langue alignée.
Ainsi, il sera possible de former plus aisément un lexique du conseil dans une langue grâce à des corpus parallèles. Le niveau de langue utilisé dans les diverses langues sera également un des éléments constatable, spécialement lorsqu'il s'agit de langues aussi éloignées que l'anglais et le japonais.


Page Précédente Page Suivante

©2008-2009 Marion Iché - Richard Delaplace