Vendredi 20 Octobre 2006 22:41:18

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200606"><JOUR="20060606"><HEURE="2006060612">
<HAP1><HAP1-et-2>Le</HAP1-et-2></HAP1> représentant de la <HAP1><HAP1-et-2>diplomatie</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>européenne</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>Javier</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>Solana</HAP1-et-2></HAP1>, a <HAP1><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>remis</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP1>,
<HAP1><HAP1-et-2>mardi</HAP1-et-2></HAP1> <HAP1><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>matin</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP1> 6 <HAP1><HAP1-et-2>juin</HAP1-et-2></HAP1>, à <HAP1><HAP1-et-2>Téhéran</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>une</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>offre</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>des</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>grandes</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>puissances</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>visant</HAP1-et-2></HAP1>
à <HAP1><HAP1-et-2>régler</HAP1-et-2></HAP1> le <HAP1><HAP1-et-2>conflit</HAP1-et-2></HAP1> du nucléaire iranien, a <HAP1><HAP1-et-2>indiqué</HAP1-et-2></HAP1> <HAP1><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>aux</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP1> <HAP1><HAP1-et-2>journalistes</HAP1-et-2></HAP1>
le <HAP1><HAP1-et-2>négociateur</HAP1-et-2></HAP1> en <HAP1><HAP1-et-2>chef</HAP1-et-2></HAP1> du nucléaire iranien, <HAP1><HAP1-et-2>Ali</HAP1-et-2></HAP1> Larijani.
"<HAP1><HAP1-et-2>Nous</HAP1-et-2></HAP1> <HAP1><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>avons</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP1> <HAP1><HAP1-et-2>discuté</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>un</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>peu</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>plus</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>deux</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>heures</HAP1-et-2></HAP1>", a <HAP1><HAP1-et-2>précisé</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>M</HAP1-et-2></HAP1>.
Larijani, <HAP1><HAP1-et-2>secrétaire</HAP1-et-2></HAP1> du <HAP1><HAP1-et-2>Conseil</HAP1-et-2></HAP1> <HAP1><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>suprême</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP1> de la <HAP1><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>sécurité</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP1> <HAP1><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>nationale</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP1>, à
l'<HAP1><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>issue</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP1> de <HAP1><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>son</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP1> <HAP1><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>entretien</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP1> <HAP1><HAP1-et-2>avec</HAP1-et-2></HAP1> le <HAP1><HAP1-et-2>haut</HAP1-et-2></HAP1> représentant de l'<HAP1><HAP1-et-2>UE</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>pour</HAP1-et-2></HAP1> la
<HAP1><HAP1-et-2>politique</HAP1-et-2></HAP1> <HAP1><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>extérieure</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP1>, en <HAP1><HAP1-et-2>précisant</HAP1-et-2></HAP1> que <HAP1><HAP1-et-2>ce</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>dernier</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>avait</HAP1-et-2></HAP1> "<HAP1><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>soumis</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP1> les
<HAP1><HAP1-et-2>propositions</HAP1-et-2></HAP1>" <HAP1><HAP1-et-2>et</HAP1-et-2></HAP1> que "les <HAP1><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>discussions</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP1>" <HAP1><HAP1-et-2>avaient</HAP1-et-2></HAP1> <HAP1><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>été</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP1> "<HAP1><HAP1-<HAP1-et-2>et</HAP1-et-2>-2>bonnes</HAP1-<HAP1-et-2>et</HAP1-et-2>-2></HAP1>".
§