Vendredi 20 Octobre 2006 22:40:52

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200609"><JOUR="20060916"><HEURE="2006091613">
Les <HAP1><HAP1-et-2>sept</HAP1-et-2></HAP1> candidats éventuels à l'investiture socialiste pour la
présidentielle <HAP1>sont</HAP1> <HAP1><HAP1-et-2>réunis</HAP1-et-2></HAP1>, samedi 16 septembre, à Lens
(Pas-de-Calais), pour <HAP1>un</HAP1> débat strictement réglementé, à quinze jours
<HAP1>du</HAP1> dépôt des candidatures à l'investiture. <HAP1><HAP1-et-2>A</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>leur</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>arrivée</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>ils</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>ont</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>été</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>accueillis</HAP1-et-2></HAP1> par <HAP1><HAP1-et-2>une</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>forêt</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>micros</HAP1-et-2></HAP1> et <HAP1><HAP1-et-2>d</HAP1-et-2></HAP1>'<HAP1><HAP1-et-2>appareils</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>photo</HAP1-et-2></HAP1>.

FICHIER 2

§ <MOIS="200609"><JOUR="20060916"><HEURE="2006091616">
<HAP2><HAP1-et-2>Sept</HAP1-et-2></HAP2> candidats éventuels à l'investiture socialiste pour la
présidentielle se <HAP1>sont</HAP1> <HAP2><HAP1-et-2>retrouvés</HAP1-et-2></HAP2>, samedi 16 septembre, à Lens
(Pas-de-Calais), pour <HAP1>un</HAP1> débat strictement réglementé, à quinze jours
<HAP1>du</HAP1> dépôt des candidatures à l'investiture.
Les <HAP2><HAP1-et-2>orateurs</HAP1-et-2></HAP2> se <HAP1>sont</HAP1> <HAP2><HAP1-et-2>exprimés</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>dans</HAP1-et-2></HAP2> <HAP1>un</HAP1> <HAP2><HAP1-et-2>ordre</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>déterminé</HAP1-et-2></HAP2> par <HAP1>un</HAP1> <HAP2><HAP1-et-2>tirage</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>au</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>sort</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Ségolène</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Royal</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>qui</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>devait</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>partir</HAP1-et-2></HAP2> à <HAP2><HAP1-et-2>Madrid</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>a</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>néanmoins</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>eu</HAP1-et-2></HAP2> le
<HAP2><HAP1-et-2>privilège</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>commencer</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Se</HAP1-et-2></HAP2> <HAP1>sont</HAP1> <HAP2><HAP1-et-2>ensuite</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>succédé</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Lionel</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Jospin</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>Jack</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>Lang</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>Dominique</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Strauss</HAP1-et-2></HAP2>-<HAP2><HAP1-et-2>Kahn</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>Martine</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Aubry</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>Laurent</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Fabius</HAP1-et-2></HAP2> et, <HAP2><HAP1-et-2>en</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>clôture</HAP1-et-2></HAP2>, le <HAP2><HAP1-et-2>premier</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>secrétaire</HAP1-et-2></HAP2> <HAP1>du</HAP1> <HAP2><HAP1-et-2>parti</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>François</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Hollande</HAP1-et-2></HAP2>.