Vendredi 20 Octobre 2006 22:34:46

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200602"><JOUR="20060228"><HEURE="2006022810">
Au moins <HAP1><HAP1-et-2>quinze</HAP1-et-2></HAP1> <HAP1>personnes</HAP1> ont <HAP1>été</HAP1> tuées, mardi 28 février, dans
l'<HAP1><HAP1-et-2>explosion</HAP1-et-2></HAP1> d'un véhicule qui transportait des militants antimaoïstes
dans l'Etat du Chattisgarh (centre de l'Inde), un attentat <HAP1><HAP1-et-2>imputé</HAP1-et-2></HAP1> à la
rébellion maoïste, a déclaré la police.
"<HAP2>Nous</HAP2> <HAP1><HAP1-et-2>ne</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>connaissons</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>pas</HAP1-et-2></HAP1> le <HAP1><HAP1-et-2>nombre</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>exact</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>victimes</HAP1-et-2></HAP1> mais de 15 à 20
<HAP1><HAP1-et-2>civils</HAP1-et-2></HAP1> <HAP1>sont</HAP1> <HAP2>morts</HAP2>", a indiqué à l'AFP un haut responsable de la
police dans la <HAP1>région</HAP1>. Un précédent <HAP1>bilan</HAP1> annoncé par Reuters, qui
citait la police, faisait <HAP1>état</HAP1> d'au moins cinquante <HAP2>morts</HAP2>. <HAP1>Le</HAP1> groupe
antimaoïste visé par l'attentat <HAP1>était</HAP1>, semble-<HAP1>t</HAP1>-<HAP1>il</HAP1>, soutenu par le
gouvernement indien.
BASTION MAOÏSTE
L'attentat, qui intervient à la veille de la visite d'Etat du
président américain, George W. Bush, <HAP1>en</HAP1> Inde, <HAP1>s</HAP1>'est produit <HAP1><HAP1-et-2>près</HAP1-et-2></HAP1> de
<HAP2>Darmagura</HAP2>, à un <HAP1><HAP1-et-2>demi</HAP1-et-2></HAP1>-<HAP1><HAP1-et-2>millier</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>kilomètres</HAP1-et-2></HAP1> au sud de <HAP1>Raipur</HAP1>, la
capitale régionale.
"<HAP1>Les</HAP1> maoïstes ont fait exploser <HAP1>une</HAP1> <HAP1>mine</HAP1> antipersonnel au passage d'un
camion", a précisé un haut responsable de la police, avant d'ajouter :
"<HAP2>Nous</HAP2> attendons encore des <HAP1>informations</HAP1> sur <HAP1>les</HAP1> blessés."
<HAP2>Darmagura</HAP2> est un bastion des rebelles maoïstes qui <HAP1><HAP1-et-2>disent</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>combattre</HAP1-et-2></HAP1> au
<HAP1><HAP1-et-2>nom</HAP1-et-2></HAP1> des <HAP1><HAP1-et-2>paysans</HAP1-et-2></HAP1> sans terre.

FICHIER 2

§ <MOIS="200602"><JOUR="20060228"><HEURE="2006022811">
Au moins 20 <HAP1>personnes</HAP1> ont <HAP1>été</HAP1> tuées mardi 28 février dans un attentat
<HAP2><HAP1-et-2>contre</HAP1-et-2></HAP2> un véhicule qui transportait des militants antimaoïstes dans le
centre de l'Inde, a indiqué la police qui a <HAP2><HAP1-et-2>attribué</HAP1-et-2></HAP2> l'attentat à la
rébellion maoïste. "<HAP2><HAP1-et-2>A</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>ce</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>stade</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>nous</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>savons</HAP1-et-2></HAP2> que 20 <HAP1>personnes</HAP1> <HAP1>sont</HAP1>
mortes. <HAP2><HAP1-et-2>Environ</HAP1-et-2></HAP2> 35 à 40 <HAP1>personnes</HAP1> <HAP1>sont</HAP1> blessées. <HAP2><HAP1-et-2>C</HAP1-et-2></HAP2>'<HAP1>était</HAP1> un attentat
à la <HAP1>mine</HAP1>", a <HAP2><HAP1-et-2>dit</HAP1-et-2></HAP2> un haut responsable des <HAP2><HAP1-et-2>services</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>renseignement</HAP1-et-2></HAP2> de
la police <HAP2><HAP1-et-2>locale</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>S</HAP1-et-2></HAP2>.<HAP2><HAP1-et-2>K</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Paswan</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>joint</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>depuis</HAP1-et-2></HAP2> <HAP1>Raipur</HAP1>, dans l'Etat de
Chattisgarh.
<HAP1>Le</HAP1> <HAP1>bilan</HAP1> <HAP2><HAP1-et-2>pourrait</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>cependant</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>être</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>plus</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>élevé</HAP1-et-2></HAP2>, a <HAP2><HAP1-et-2>estimé</HAP1-et-2></HAP2> <HAP1>une</HAP1> <HAP2><HAP1-et-2>porte</HAP1-et-2></HAP2>-<HAP2><HAP1-et-2>parole</HAP1-et-2></HAP2>
de la police du <HAP2><HAP1-et-2>district</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>Dandewada</HAP1-et-2></HAP2> <HAP2><HAP1-et-2></HAP1-et-2></HAP2> l'attentat a <HAP1>été</HAP1> <HAP2><HAP1-et-2>perpétré</HAP1-et-2></HAP2>.
"<HAP1>Les</HAP1> <HAP1>informations</HAP1> <HAP2><HAP1-et-2>préliminaires</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>indiquent</HAP1-et-2></HAP2> que 25 <HAP1>personnes</HAP1> <HAP1>sont</HAP1> mortes
mais <HAP2><HAP1-et-2>comme</HAP1-et-2></HAP2> <HAP1>il</HAP1> <HAP1>s</HAP1>'<HAP2><HAP1-et-2>agit</HAP1-et-2></HAP2> d'<HAP1>une</HAP1> <HAP1>région</HAP1> <HAP2><HAP1-et-2>très</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>reculée</HAP1-et-2></HAP2>, <HAP1>les</HAP1> <HAP2><HAP1-et-2>officiers</HAP1-et-2></HAP2> <HAP1>sont</HAP1>
<HAP2><HAP1-et-2>toujours</HAP1-et-2></HAP2> <HAP1>en</HAP1> <HAP2><HAP1-et-2>train</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>déterminer</HAP1-et-2></HAP2> combien ont <HAP1>été</HAP1> blessées, combien
<HAP1>sont</HAP1> dans un <HAP1>état</HAP1> <HAP2><HAP1-et-2>critique</HAP1-et-2></HAP2> et combien <HAP1>sont</HAP1> mortes", a-<HAP1>t</HAP1>-<HAP2><HAP1-et-2>elle</HAP1-et-2></HAP2> déclaré
à l'AFP.
Un précédent <HAP1>bilan</HAP1> annoncé par Reuters, qui citait la police, faisait
<HAP1>état</HAP1> d'au moins cinquante <HAP2>morts</HAP2>. <HAP1>Le</HAP1> groupe antimaoïste visé par
l'attentat <HAP1>était</HAP1>, semble-<HAP1>t</HAP1>-<HAP1>il</HAP1>, soutenu par le gouvernement indien.
BASTION MAOÏSTE
L'attentat, qui intervient à la veille de la visite d'Etat du
président américain, George W. Bush, <HAP1>en</HAP1> Inde, <HAP1>s</HAP1>'est produit dans un
<HAP2><HAP1-et-2>village</HAP1-et-2></HAP2> de la <HAP1>région</HAP1> de <HAP2><HAP1-et-2>Darbhaguda</HAP1-et-2></HAP2>, à 550 <HAP2><HAP1-et-2>km</HAP1-et-2></HAP2> au sud de <HAP1>Raipur</HAP1>, la
capitale régionale.
"<HAP1>Les</HAP1> maoïstes ont fait exploser <HAP1>une</HAP1> <HAP1>mine</HAP1> antipersonnel au passage d'un
camion", a précisé un haut responsable de la police, avant d'ajouter :
"<HAP2>Nous</HAP2> attendons encore des <HAP1>informations</HAP1> sur <HAP1>les</HAP1> blessés."
<HAP2>Darmagura</HAP2> est un bastion des rebelles maoïstes <HAP2><HAP1-et-2>indiens</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Ceux</HAP1-et-2></HAP2>-<HAP2><HAP1-et-2>ci</HAP1-et-2></HAP2> ont
des <HAP2><HAP1-et-2>bases</HAP1-et-2></HAP2> dans <HAP2><HAP1-et-2>plusieurs</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Etats</HAP1-et-2></HAP2> et ont <HAP2><HAP1-et-2>récemment</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>intensifié</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>leurs</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>attaques</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Ils</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>se</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>battent</HAP1-et-2></HAP2> pour <HAP2><HAP1-et-2>obtenir</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>meilleurs</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>conditions</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>économiques</HAP1-et-2></HAP2> et des <HAP2><HAP1-et-2>droits</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>sociaux</HAP1-et-2></HAP2> pour <HAP1>les</HAP1> <HAP2><HAP1-et-2>tribus</HAP1-et-2></HAP2> et <HAP1>les</HAP1> <HAP2><HAP1-et-2>fermiers</HAP1-et-2></HAP2> sans
terre <HAP2><HAP1-et-2>deszones</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>rurales</HAP1-et-2></HAP2>..