Vendredi 20 Octobre 2006 22:38:18

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200602"><JOUR="20060212"><HEURE="2006021214">
Le <HAP2>Français</HAP2> Antoine Dénériaz a créé l'<HAP1><HAP1-et-2>évènement</HAP1-et-2></HAP1> en raflant la
médaille d'or de descente hommes de ski alpin, l'épreuve phare du
<HAP2>deuxième</HAP2> jour des JO de Turin, <HAP1>dimanche</HAP1> 12 février, à Sestrières. Avec
un <HAP1>temps</HAP1> de 1 <HAP1><HAP1-et-2>minutes</HAP1-et-2></HAP1> 48 secondes, il devance l'Autrichien Michael
Walchhofer qui avait tenu la tête de la compétition pendant une grande
partie de l'épreuve et qui termine <HAP2>deuxième</HAP2> du <HAP2>podium</HAP2> <HAP1><HAP1-et-2>devant</HAP1-et-2></HAP1> le Suisse
Bruno Kernen.
"Je ne pense <HAP1>qu</HAP1>'à ça depuis trois jours, même depuis un an", a
<HAP1>commenté</HAP1> Antoine Dénériaz, 29 ans, à la sortie de l'épreuve. Le
<HAP2>Français</HAP2>, vainqueur de trois descentes en Coupe du monde en 2004-2005,
avait terminé 12^e aux JO de <HAP1>Salt</HAP1> <HAP1>Lake</HAP1> <HAP1>City</HAP1> en 2002. "Aujourd'hui, les
zéro pointés des deux derniers <HAP1><HAP1-et-2>Championnats</HAP1-et-2></HAP1> du monde sont effacés et
je suis sûr que mes copains <HAP1>dans</HAP1> les prochains jours vont faire
<HAP1>pareil</HAP1>. Je dédie cette médaille à <HAP1>tous</HAP1> ceux qui m'ont supporté et
m'ont aidé <HAP1>après</HAP1> ma <HAP1>blessure</HAP1> de l'année dernière", a-t-il ajouté.
Parmi les autres surprises de cette épreuve, l'absence sur le <HAP2>podium</HAP2>
des grands favoris : le tenant du <HAP1>titre</HAP1> Fritz Strobl mais aussi
l'Allemand Herman Maier et l'Américain Bode Miller. Maier, grippé
avant l'épreuve a manqué de force pour partir à l'assaut d'une
médaille et a terminé 6^e. Tandis que le skieur le plus médiatique,
Bode Miller, qui n'avait même pas participé à la reconnaissance de
piste le matin même, a perdu plusieurs dixièmes sur le bas du parcours
et a terminé à la 5^e place.

FICHIER 2

§ <MOIS="200602"><JOUR="20060212"><HEURE="2006021215">
Le <HAP2>Français</HAP2> Antoine Dénériaz a créé l'<HAP2><HAP1-et-2>événement</HAP1-et-2></HAP2> en raflant la
médaille d'or de descente hommes de ski alpin, l'épreuve phare du
<HAP2>deuxième</HAP2> jour des JO de Turin, <HAP1>dimanche</HAP1> 12 février, à Sestrières. Avec
un <HAP1>temps</HAP1> de 1 <HAP2><HAP1-et-2>minute</HAP1-et-2></HAP2> 48 secondes, il devance l'Autrichien Michael
Walchhofer qui avait tenu la tête de la compétition pendant une grande
partie de l'épreuve et qui termine <HAP2><HAP1-et-2>deuxièmedevant</HAP1-et-2></HAP2> le Suisse Bruno
Kernen.
"Je ne pense <HAP1>qu</HAP1>'à ça depuis trois jours, même depuis un an", a
<HAP1>commenté</HAP1> Antoine Dénériaz, 29 ans, à la sortie de l'épreuve. Le
<HAP2><HAP1-et-2>colosse</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>Morillon</HAP1-et-2></HAP2>, vainqueur de trois descentes en Coupe du monde en
2004-2005, avait terminé 12^e aux JO de <HAP1>Salt</HAP1> <HAP1>Lake</HAP1> <HAP1>City</HAP1> en 2002.
"Aujourd'hui, les zéro pointés des deux derniers <HAP2><HAP1-et-2>championnats</HAP1-et-2></HAP2> du monde
sont effacés et je suis sûr que mes copains <HAP1>dans</HAP1> les prochains jours
vont faire <HAP1>pareil</HAP1>. Je dédie cette médaille à <HAP1>tous</HAP1> ceux qui m'ont
supporté et m'ont aidé <HAP1>après</HAP1> ma <HAP1>blessure</HAP1> de l'année dernière", a-t-il
ajouté.
Le ministre des <HAP2><HAP1-et-2>sports</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>Jean</HAP1-et-2></HAP2>-<HAP2><HAP1-et-2>François</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Lamour</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>s</HAP1-et-2></HAP2>'est <HAP2><HAP1-et-2>félicité</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>ce</HAP1-et-2></HAP2>
<HAP1>titre</HAP1> olympique." C'est un <HAP2><HAP1-et-2>grand</HAP1-et-2></HAP2> champion, qui revient de <HAP1>blessure</HAP1>. <HAP2><HAP1-et-2>Il</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>se</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>blesse</HAP1-et-2></HAP2> à un <HAP2><HAP1-et-2>genou</HAP1-et-2></HAP2> et il revient", a déclaré le ministre <HAP2><HAP1-et-2>présent</HAP1-et-2></HAP2>
<HAP1>dans</HAP1> l'<HAP2><HAP1-et-2>aire</HAP1-et-2></HAP2> d'<HAP2><HAP1-et-2>arrivée</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>De</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>son</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>côté</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>Henri</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Sérandour</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>président</HAP1-et-2></HAP2> du
<HAP2><HAP1-et-2>Comité</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>national</HAP1-et-2></HAP2> olympique et <HAP2><HAP1-et-2>sportif</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>français</HAP1-et-2></HAP2> (<HAP2><HAP1-et-2>CNOSF</HAP1-et-2></HAP2>) a déclaré que
"la victoire d'Antoine Dénériaz, est une <HAP2><HAP1-et-2>grosse</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>émotion</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Mais</HAP1-et-2></HAP2> c'est
<HAP2><HAP1-et-2>surtout</HAP1-et-2></HAP2> la victoire d'un <HAP2><HAP1-et-2>garçon</HAP1-et-2></HAP2> qui <HAP2><HAP1-et-2>y</HAP1-et-2></HAP2> a <HAP2><HAP1-et-2>toujours</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>cru</HAP1-et-2></HAP2> en <HAP2><HAP1-et-2>dépit</HAP1-et-2></HAP2> de <HAP1>tous</HAP1>
les <HAP2><HAP1-et-2>pépins</HAP1-et-2></HAP2> <HAP1>qu</HAP1>'il a <HAP2><HAP1-et-2>connus</HAP1-et-2></HAP2>".
"<HAP2><HAP1-et-2>En</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>regardant</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>sa</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>course</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>j</HAP1-et-2></HAP2>'<HAP2><HAP1-et-2>ai</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>chialé</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>tout</HAP1-et-2></HAP2> le <HAP2><HAP1-et-2>long</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>D</HAP1-et-2></HAP2>'<HAP2><HAP1-et-2>abord</HAP1-et-2></HAP2> c'était le
<HAP2><HAP1-et-2>stress</HAP1-et-2></HAP2> et <HAP1>après</HAP1> le 2^e <HAP1>temps</HAP1> <HAP2><HAP1-et-2>intermédiaire</HAP1-et-2></HAP2>, c'était des <HAP2><HAP1-et-2>larmes</HAP1-et-2></HAP2>
d'<HAP2><HAP1-et-2>envie</HAP1-et-2></HAP2>. C'est un <HAP2><HAP1-et-2>très</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>beau</HAP1-et-2></HAP2> champion olympique, c'est un <HAP2><HAP1-et-2>mec</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>géant</HAP1-et-2></HAP2>",
a <HAP1>commenté</HAP1> la <HAP2><HAP1-et-2>skieuse</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>française</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Carole</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Montillet</HAP1-et-2></HAP2> qui avait <HAP2><HAP1-et-2>connu</HAP1-et-2></HAP2>
<HAP1>pareil</HAP1> <HAP2><HAP1-et-2>bonheur</HAP1-et-2></HAP2> en 2002 à <HAP1>Salt</HAP1> <HAP1>Lake</HAP1> <HAP1>City</HAP1>.
Parmi les autres surprises de cette épreuve, <HAP1>dimanche</HAP1>, l'absence sur
le <HAP2>podium</HAP2> des grands favoris : le tenant du <HAP1>titre</HAP1> Fritz Strobl mais
aussi l'Allemand Herman Maier et l'Américain Bode Miller. Maier,
grippé avant l'épreuve, a manqué de force pour partir à l'assaut d'une
médaille et a terminé 6^e. Tandis que le skieur le plus médiatique,
Bode Miller, qui n'avait pas participé à la reconnaissance de piste le
matin même, a perdu plusieurs dixièmes sur le bas du parcours et a
terminé à la 5^e place.