Vendredi 20 Octobre 2006 22:36:37

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200602"><JOUR="20060217"><HEURE="2006021701">
Le <HAP1><HAP1-et-2>triomphe</HAP1-et-2></HAP1> d'<HAP1>Evgueni</HAP1> <HAP1><HAP1-et-2>Plushenko</HAP1-et-2></HAP1> <HAP1>était</HAP1> <HAP1><HAP1-et-2>annoncé</HAP1-et-2></HAP1>. <HAP1>Jeudi</HAP1> 16 février, le
<HAP1><HAP1-et-2>prodige</HAP1-et-2></HAP1> russe a <HAP1><HAP1-et-2>remporté</HAP1-et-2></HAP1> son <HAP2>premier</HAP2> <HAP2>titre</HAP2> olympique, le <HAP1><HAP1-et-2>seul</HAP1-et-2></HAP1> <HAP1>qui</HAP1>
<HAP1><HAP1-et-2>manquait</HAP1-et-2></HAP1> à son <HAP1><HAP1-et-2>impressionnant</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>palmarès</HAP1-et-2></HAP1>. <HAP1><HAP1-et-2>Avec</HAP1-et-2></HAP1> un <HAP1><HAP1-et-2>total</HAP1-et-2></HAP1> de 258 points
<HAP2>sur</HAP2> l'<HAP1><HAP1-et-2>ensemble</HAP1-et-2></HAP1> de la <HAP1><HAP1-et-2>compétition</HAP1-et-2></HAP1>, il a <HAP2>largement</HAP2> <HAP1><HAP1-et-2>dominé</HAP1-et-2></HAP1> ses
<HAP1><HAP1-et-2>concurrents</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>reléguant</HAP1-et-2></HAP1> au <HAP1><HAP1-et-2>rang</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>figurants</HAP1-et-2></HAP1> le <HAP2>Suisse</HAP2> <HAP2>Stéphane</HAP2> <HAP2>Lambiel</HAP2>
et le Canadien Jeffrey Buttle, médailles d'argent et de bronze, à 27
et 31 points.
Le <HAP1>triple</HAP1> champion du <HAP1><HAP1-et-2>monde</HAP1-et-2></HAP1> et <HAP1><HAP1-et-2>quintuple</HAP1-et-2></HAP1> champion d'Europe a réussi un
<HAP1><HAP1-et-2>parcours</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>sans</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>faute</HAP1-et-2></HAP1>, <HAP2>ne</HAP2> <HAP1><HAP1-et-2>marquant</HAP1-et-2></HAP1> qu'une <HAP1><HAP1-et-2>légère</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>hésitation</HAP1-et-2></HAP1> <HAP2>sur</HAP2> un saut.
<HAP1><HAP1-et-2>Déjà</HAP1-et-2></HAP1> <HAP2>largement</HAP2> en <HAP1><HAP1-et-2>tête</HAP1-et-2></HAP1> du classement à l'<HAP2>issue</HAP2> du programme court, il
a <HAP1><HAP1-et-2>ainsi</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>presque</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>triplé</HAP1-et-2></HAP1> son <HAP1><HAP1-et-2>avance</HAP1-et-2></HAP1> en <HAP1><HAP1-et-2>termes</HAP1-et-2></HAP1> de points. A 24 <HAP1>ans</HAP1>, il
<HAP1><HAP1-et-2>remporte</HAP1-et-2></HAP1> son <HAP2>premier</HAP2> <HAP2>titre</HAP2> olympique, <HAP2>après</HAP2> <HAP1><HAP1-et-2>avoir</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>décroché</HAP1-et-2></HAP1> une
médaille d'argent à <HAP1><HAP1-et-2>Salt</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>Lake</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>City</HAP1-et-2></HAP1> en 2002.
"<HAP2>J</HAP2>'<HAP1><HAP1-et-2>AI</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>PRIS</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>DES</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>RISQUES</HAP1-et-2></HAP1>"
Brian Joubert a en revanche déçu, <HAP1><HAP1-et-2>posant</HAP1-et-2></HAP1> à <HAP1><HAP1-et-2>deux</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>reprises</HAP1-et-2></HAP1> la <HAP1><HAP1-et-2>main</HAP1-et-2></HAP1> <HAP2>sur</HAP2>
la glace et <HAP1><HAP1-et-2>chutant</HAP1-et-2></HAP1> <HAP2>sur</HAP2> l'un de ses <HAP1><HAP1-et-2>derniers</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>sauts</HAP1-et-2></HAP1>. Le <HAP1>Français</HAP1> <HAP2>ne</HAP2>
<HAP1><HAP1-et-2>termine</HAP1-et-2></HAP1> la <HAP1><HAP1-et-2>compétiton</HAP1-et-2></HAP1> qu'en <HAP1><HAP1-et-2>sixième</HAP1-et-2></HAP1> position, <HAP1><HAP1-et-2>alors</HAP1-et-2></HAP1> qu'il se <HAP1><HAP1-et-2>classait</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>quatrième</HAP1-et-2></HAP1> <HAP2>après</HAP2> le programme court. "<HAP2>J</HAP2>'ai pris <HAP2>des</HAP2> risques, a-t-il
déclaré au <HAP1><HAP1-et-2>micro</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>France</HAP1-et-2></HAP1> 2 <HAP2>après</HAP2> son <HAP1><HAP1-et-2>passage</HAP1-et-2></HAP1> <HAP2>sur</HAP2> la glace. <HAP1><HAP1-et-2>Mais</HAP1-et-2></HAP1> <HAP1>avec</HAP1>
la nouvelle notation, il <HAP2>ne</HAP2> faut <HAP1>pas</HAP1>."
<HAP1><HAP1-et-2>Troisième</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>avant</HAP1-et-2></HAP1> le programme <HAP1>libre</HAP1>, le <HAP2>Suisse</HAP2> <HAP2>Stéphane</HAP2> <HAP2>Lambiel</HAP2> a <HAP1><HAP1-et-2>quant</HAP1-et-2></HAP1>
à lui réussi à se <HAP1><HAP1-et-2>hisser</HAP1-et-2></HAP1> en <HAP2>deuxième</HAP2> position au classement <HAP1><HAP1-et-2>général</HAP1-et-2></HAP1>,
<HAP1><HAP1-et-2>malgré</HAP1-et-2></HAP1> un <HAP1><HAP1-et-2>sérieux</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>déséquilibre</HAP1-et-2></HAP1> et une <HAP1><HAP1-et-2>chute</HAP1-et-2></HAP1>.
<HAP1><HAP1-et-2>Johnny</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>Weir</HAP1-et-2></HAP1>, champion <HAP2>des</HAP2> <HAP1><HAP1-et-2>Etats</HAP1-et-2></HAP1>-<HAP1><HAP1-et-2>Unis</HAP1-et-2></HAP1> et <HAP2>deuxième</HAP2> à l'<HAP2>issue</HAP2> du
programme court, mardi, est pour sa <HAP1><HAP1-et-2>part</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>descendu</HAP1-et-2></HAP1> du podium. <HAP1><HAP1-et-2>Malgré</HAP1-et-2></HAP1>
une <HAP1><HAP1-et-2>belle</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>prestation</HAP1-et-2></HAP1>, il <HAP2>ne</HAP2> s'est <HAP1><HAP1-et-2>vu</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>attribuer</HAP1-et-2></HAP1> qu'une <HAP1><HAP1-et-2>note</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>totale</HAP1-et-2></HAP1> de
216 points, <HAP1><HAP1-et-2>sous</HAP1-et-2></HAP1> <HAP1>les</HAP1> <HAP1><HAP1-et-2>sifflets</HAP1-et-2></HAP1> d'un <HAP1><HAP1-et-2>public</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>contestant</HAP1-et-2></HAP1> la <HAP1><HAP1-et-2>décision</HAP1-et-2></HAP1> <HAP2>des</HAP2>
<HAP1><HAP1-et-2>juges</HAP1-et-2></HAP1>.

FICHIER 2

§ <MOIS="200602"><JOUR="20060217"><HEURE="2006021717">
<HAP2><HAP1-et-2>C</HAP1-et-2></HAP2>'<HAP1>était</HAP1> lui et <HAP1>les</HAP1> <HAP2><HAP1-et-2>autres</HAP1-et-2></HAP2>. <HAP1>Jeudi</HAP1> 16 février, dans une patinoire
<HAP2><HAP1-et-2>chavirée</HAP1-et-2></HAP2>, <HAP1>Evgueni</HAP1> Plouchenko est <HAP2><HAP1-et-2>devenu</HAP1-et-2></HAP2> champion olympique au <HAP2><HAP1-et-2>terme</HAP1-et-2></HAP2>
d'un programme <HAP1>libre</HAP1> <HAP2><HAP1-et-2>maîtrisé</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>L</HAP1-et-2></HAP2>'<HAP2><HAP1-et-2>affaire</HAP1-et-2></HAP2>, il est <HAP2><HAP1-et-2>vrai</HAP1-et-2></HAP2>, <HAP1>était</HAP1> <HAP2><HAP1-et-2>quasi</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>entendue</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>dès</HAP1-et-2></HAP2> le programme court, mardi. Le <HAP2><HAP1-et-2>patineur</HAP1-et-2></HAP2> russe <HAP2><HAP1-et-2>y</HAP1-et-2></HAP2> avait
<HAP2><HAP1-et-2>frôlé</HAP1-et-2></HAP2> la <HAP2><HAP1-et-2>perfection</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>distançant</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>déjà</HAP1-et-2></HAP2> ses <HAP2><HAP1-et-2>adversaires</HAP1-et-2></HAP2>.
<HAP1>Jeudi</HAP1> <HAP2><HAP1-et-2>soir</HAP1-et-2></HAP2>, à la <HAP2><HAP1-et-2>faveur</HAP1-et-2></HAP2> du <HAP2><HAP1-et-2>tirage</HAP1-et-2></HAP2> au <HAP2><HAP1-et-2>sort</HAP1-et-2></HAP2>, <HAP1>Evgueni</HAP1> Plouchenko a patiné
comme il l'<HAP2><HAP1-et-2>aime</HAP1-et-2></HAP2>, en <HAP2>premier</HAP2> du <HAP2><HAP1-et-2>dernier</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>groupe</HAP1-et-2></HAP2>. Son programme a été
<HAP2><HAP1-et-2>effarant</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>simplicité</HAP1-et-2></HAP2>, de <HAP2><HAP1-et-2>puissance</HAP1-et-2></HAP2> - d'<HAP2><HAP1-et-2>entrée</HAP1-et-2></HAP2>, une <HAP1>triple</HAP1>
<HAP2><HAP1-et-2>combinaison</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>quadruple</HAP1-et-2></HAP2> saut, <HAP1>triple</HAP1>, <HAP2><HAP1-et-2>double</HAP1-et-2></HAP2> -, et de <HAP2><HAP1-et-2>virtuosité</HAP1-et-2></HAP2> - ces
<HAP2><HAP1-et-2>pirouettes</HAP1-et-2></HAP2> comme <HAP2><HAP1-et-2>infinies</HAP1-et-2></HAP2> et ces <HAP2><HAP1-et-2>fameux</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>petits</HAP1-et-2></HAP2> <HAP1>pas</HAP1> <HAP2><HAP1-et-2>aériens</HAP1-et-2></HAP2> <HAP1>qui</HAP1> <HAP2><HAP1-et-2>sont</HAP1-et-2></HAP2> sa
<HAP2><HAP1-et-2>griffe</HAP1-et-2></HAP2>.
A 23 <HAP1>ans</HAP1>, le <HAP2><HAP1-et-2>Russe</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>ajoute</HAP1-et-2></HAP2> le <HAP2>titre</HAP2> olympique à ses <HAP2><HAP1-et-2>trois</HAP1-et-2></HAP2> médailles
<HAP2><HAP1-et-2>mondiales</HAP1-et-2></HAP2> (2001, 2003, 2004) et à ses <HAP2><HAP1-et-2>cinq</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>titres</HAP1-et-2></HAP2> de champion d'Europe
(2000, 2001, 2003, 2005, 2006). <HAP2><HAP1-et-2>Talentueux</HAP1-et-2></HAP2>, il a été <HAP2><HAP1-et-2>bien</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>entouré</HAP1-et-2></HAP2>, et
très <HAP2><HAP1-et-2>tôt</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Lorsqu</HAP1-et-2></HAP2>'il avait 11 <HAP1>ans</HAP1>, en 1994, la patinoire où il
s'<HAP2><HAP1-et-2>entraînait</HAP1-et-2></HAP2> a <HAP2><HAP1-et-2>fermé</HAP1-et-2></HAP2>. Son <HAP2><HAP1-et-2>entraîneur</HAP1-et-2></HAP2> l'a <HAP2><HAP1-et-2>emmené</HAP1-et-2></HAP2> à <HAP2><HAP1-et-2>Saint</HAP1-et-2></HAP2>-<HAP2><HAP1-et-2>Pétersbourg</HAP1-et-2></HAP2>,
où il a <HAP2><HAP1-et-2>rencontré</HAP1-et-2></HAP2> Alexei <HAP2><HAP1-et-2>Mishine</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>celui</HAP1-et-2></HAP2> <HAP1>qui</HAP1> <HAP2><HAP1-et-2>entraîna</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>aussi</HAP1-et-2></HAP2> <HAP1>les</HAP1>
<HAP2><HAP1-et-2>champions</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>olympiques</HAP1-et-2></HAP2> Alexei <HAP2><HAP1-et-2>Urmanov</HAP1-et-2></HAP2> (1994) et Alexei <HAP2><HAP1-et-2>Yagoudine</HAP1-et-2></HAP2> (2002).
<HAP2><HAP1-et-2>Derrière</HAP1-et-2></HAP2> <HAP1>Evgueni</HAP1> Plouchenko, à <HAP2><HAP1-et-2>bonne</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>distance</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>donc</HAP1-et-2></HAP2>, <HAP2>Stéphane</HAP2> <HAP2>Lambiel</HAP2>.
Le <HAP2>Suisse</HAP2>, <HAP1>qui</HAP1> <HAP1>était</HAP1> <HAP2><HAP1-et-2>troisième</HAP1-et-2></HAP2> <HAP2>après</HAP2> le programme court, a <HAP2><HAP1-et-2>grimpé</HAP1-et-2></HAP2> à la
2^e place. <HAP2><HAP1-et-2>La</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>soirée</HAP1-et-2></HAP2> a été <HAP2><HAP1-et-2>ébouriffée</HAP1-et-2></HAP2>, <HAP1>les</HAP1> <HAP2><HAP1-et-2>classements</HAP1-et-2></HAP2> du court
<HAP2>largement</HAP2> <HAP2><HAP1-et-2>chamboulés</HAP1-et-2></HAP2>. Le Canadien Jeffrey Buttle, <HAP1>qui</HAP1> a patiné <HAP1>avec</HAP1>
<HAP2><HAP1-et-2>solidité</HAP1-et-2></HAP2> et <HAP2><HAP1-et-2>grâce</HAP1-et-2></HAP2>, est <HAP2><HAP1-et-2>passé</HAP1-et-2></HAP2> de la 6^e place à la médaille de bronze.
<HAP2><HAP1-et-2>Déception</HAP1-et-2></HAP2>, en revanche, pour Brian Joubert. <HAP2><HAP1-et-2>Quatrième</HAP1-et-2></HAP2> à l'<HAP2>issue</HAP2> du
court, le <HAP1>Français</HAP1> <HAP2><HAP1-et-2>espérait</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>poser</HAP1-et-2></HAP2> un <HAP2><HAP1-et-2>patin</HAP1-et-2></HAP2> <HAP2>sur</HAP2> le podium. <HAP1>Jeudi</HAP1>, il a
<HAP2><HAP1-et-2>chuté</HAP1-et-2></HAP2> dans le programme <HAP1>libre</HAP1>, a <HAP2><HAP1-et-2>semblé</HAP1-et-2></HAP2> un <HAP2><HAP1-et-2>peu</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>emprunté</HAP1-et-2></HAP2> et <HAP2><HAP1-et-2>terminé</HAP1-et-2></HAP2> 6^e
: "<HAP2><HAP1-et-2>Je</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>suis</HAP1-et-2></HAP2> très déçu, a-t-il déclaré. <HAP2>J</HAP2>'ai pris <HAP2>des</HAP2> risques, et <HAP1>avec</HAP1>
<HAP2><HAP1-et-2>cette</HAP1-et-2></HAP2> nouvelle notation il <HAP2>ne</HAP2> faut <HAP1>pas</HAP1> en <HAP2><HAP1-et-2>prendre</HAP1-et-2></HAP2>." Le <HAP2>deuxième</HAP2>
<HAP1>Français</HAP1> en <HAP2><HAP1-et-2>lice</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>Frédéric</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Dambier</HAP1-et-2></HAP2>, est 19^e.