Vendredi 20 Octobre 2006 22:34:12

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200603"><JOUR="20060331"><HEURE="2006033110">
La candidate de RNP (Rosa nel Pugno , <HAP1>la</HAP1> rose au poing) aux <HAP2>élections</HAP2>
du 9 <HAP1>avril</HAP1> en Italie a répondu aux questions <HAP2>des</HAP2> internautes sur <HAP2>le</HAP2>
site de La Stampa Web, mercredi 29 mars. <HAP1><HAP1-et-2>C</HAP1-et-2></HAP1>'<HAP1><HAP1-et-2>était</HAP1-et-2></HAP1> <HAP2>le</HAP2> <HAP1><HAP1-et-2>cinquième</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>entretien</HAP1-et-2></HAP1> d'<HAP1><HAP1-et-2>une</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>série</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>rendez</HAP1-et-2></HAP1>-<HAP1>vous</HAP1> <HAP1><HAP1-et-2>avec</HAP1-et-2></HAP1> les <HAP1><HAP1-et-2>candidats</HAP1-et-2></HAP1> <HAP2>des</HAP2> <HAP1><HAP1-et-2>deux</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>principales</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>coalitions</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>rivales</HAP1-et-2></HAP1> aux <HAP2>élections</HAP2> <HAP1><HAP1-et-2>législatives</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>italiennes</HAP1-et-2></HAP1>.

FICHIER 2

§ <MOIS="200603"><JOUR="20060331"><HEURE="2006033111">
La candidate de RNP (Rosa nel Pugno , <HAP1>la</HAP1> rose au poing) aux <HAP2>élections</HAP2>
du 9 <HAP1>avril</HAP1> en Italie a répondu aux questions <HAP2>des</HAP2> internautes sur <HAP2>le</HAP2>
site de La Stampa Web, mercredi 29 mars.
<HAP2><HAP1-et-2>Fin</HAP1-et-2></HAP2> d'<HAP2><HAP1-et-2>un</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>amour</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>Pietro</HAP1-et-2></HAP2> : <HAP2><HAP1-et-2>Je</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>suis</HAP1-et-2></HAP2> de gauche et <HAP2><HAP1-et-2>anti</HAP1-et-2></HAP2>-Berlusconi <HAP2><HAP1-et-2>depuis</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>toujours</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Le</HAP1-et-2></HAP2> 9
<HAP1>avril</HAP1>, je <HAP2><HAP1-et-2>voterai</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>peut</HAP1-et-2></HAP2>-<HAP2><HAP1-et-2>être</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>pour</HAP1-et-2></HAP2> <HAP1>la</HAP1> <HAP2><HAP1-et-2>RnP</HAP1-et-2></HAP2>, et <HAP2><HAP1-et-2>ceci</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>parce</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>que</HAP1-et-2></HAP2> <HAP1>vous</HAP1> <HAP1>vous</HAP1>
<HAP2><HAP1-et-2>présentez</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>dans</HAP1-et-2></HAP2> <HAP1>la</HAP1> coalition de <HAP2><HAP1-et-2>l</HAP1-et-2></HAP2>'<HAP2><HAP1-et-2>Unione</HAP1-et-2></HAP2> (<HAP2><HAP1-et-2>NdT</HAP1-et-2></HAP2> : coalition de
<HAP2><HAP1-et-2>centre</HAP1-et-2></HAP2>-gauche). <HAP2><HAP1-et-2>Mais</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>avant</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>me</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>décider</HAP1-et-2></HAP2>, je <HAP2><HAP1-et-2>voudrais</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>savoir</HAP1-et-2></HAP2> les
<HAP2><HAP1-et-2>raisons</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>qui</HAP1-et-2></HAP2> <HAP1>vous</HAP1> <HAP2><HAP1-et-2>ont</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>fait</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>passer</HAP1-et-2></HAP2> de Berlusconi <HAP2><HAP1-et-2>à</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Prodi</HAP1-et-2></HAP2>.