Vendredi 20 Octobre 2006 22:38:35

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200605"><JOUR="20060520"><HEURE="2006052009">
<HAP1><HAP1-et-2>L</HAP1-et-2></HAP1>'<HAP1><HAP1-et-2>Irak</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>attend</HAP1-et-2></HAP1>, samedi 20 mai, de <HAP1><HAP1-et-2>connaître</HAP1-et-2></HAP1> son <HAP1><HAP1-et-2>nouveau</HAP1-et-2></HAP1> gouvernement,
<HAP1><HAP1-et-2>dont</HAP1-et-2></HAP1> <HAP2>la</HAP2> <HAP1><HAP1-et-2>majorité</HAP1-et-2></HAP1> <HAP2>des</HAP2> <HAP1><HAP1-et-2>membres</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>devraient</HAP1-et-2></HAP1> être <HAP1><HAP1-et-2>présentés</HAP1-et-2></HAP1> au Parlement
dans <HAP2>la</HAP2> <HAP1><HAP1-et-2>journée</HAP1-et-2></HAP1>. <HAP1><HAP1-et-2>Cette</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>étape</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>qualifiée</HAP1-et-2></HAP1> de "<HAP1><HAP1-et-2>véritable</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>nouvelle</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>chance</HAP1-et-2></HAP1>"
à <HAP1><HAP1-et-2>Washington</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>intervient</HAP1-et-2></HAP1> dans un <HAP1><HAP1-et-2>climat</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>violences</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>ininterrompues</HAP1-et-2></HAP1>.
<HAP1><HAP1-et-2>Samedi</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>matin</HAP1-et-2></HAP1>, <HAP1>les</HAP1> <HAP1><HAP1-et-2>corps</HAP1-et-2></HAP1> de 15 personnes <HAP1><HAP1-et-2>portant</HAP1-et-2></HAP1> <HAP2>des</HAP2> <HAP1><HAP1-et-2>traces</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>torture</HAP1-et-2></HAP1>
et <HAP1><HAP1-et-2>tuées</HAP1-et-2></HAP1> par <HAP1><HAP1-et-2>balles</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>ont</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>été</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>découverts</HAP1-et-2></HAP1> à <HAP1><HAP1-et-2>Moussayeb</HAP1-et-2></HAP1>, à 55 <HAP1><HAP1-et-2>km</HAP1-et-2></HAP1> au <HAP1><HAP1-et-2>sud</HAP1-et-2></HAP1> de
<HAP1><HAP1-et-2>Bagdad</HAP1-et-2></HAP1>. <HAP1><HAP1-et-2>Dans</HAP1-et-2></HAP1> <HAP2>la</HAP2> <HAP1><HAP1-et-2>capitale</HAP1-et-2></HAP1>, <HAP2>l</HAP2>'<HAP1><HAP1-et-2>explosion</HAP1-et-2></HAP1> <HAP2>d</HAP2>'une <HAP1><HAP1-et-2>bombe</HAP1-et-2></HAP1> dans le <HAP1><HAP1-et-2>quartier</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>chiite</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>Sadr</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>City</HAP1-et-2></HAP1> a <HAP1><HAP1-et-2>tué</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>dix</HAP1-et-2></HAP1>-<HAP1><HAP1-et-2>neuf</HAP1-et-2></HAP1> personnes et <HAP1><HAP1-et-2>en</HAP1-et-2></HAP1> a <HAP1><HAP1-et-2>blessé</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>trente</HAP1-et-2></HAP1>-<HAP1><HAP1-et-2>six</HAP1-et-2></HAP1>. Les <HAP1><HAP1-et-2>faits</HAP1-et-2></HAP1> <HAP2>se</HAP2> <HAP1><HAP1-et-2>sont</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>produits</HAP1-et-2></HAP1> à un <HAP1><HAP1-et-2>endroit</HAP1-et-2></HAP1> <HAP1><HAP1-et-2></HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>nombreuses</HAP1-et-2></HAP1>
personnes <HAP2>se</HAP2> <HAP1><HAP1-et-2>présentent</HAP1-et-2></HAP1> <HAP2>pour</HAP2> <HAP1><HAP1-et-2>trouver</HAP1-et-2></HAP1> un <HAP1><HAP1-et-2>emploi</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>journalier</HAP1-et-2></HAP1>. Les
<HAP1><HAP1-et-2>victimes</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>seraient</HAP1-et-2></HAP1> <HAP2>d</HAP2>'<HAP1><HAP1-et-2>ailleurs</HAP1-et-2></HAP1> <HAP2>pour</HAP2> <HAP2>l</HAP2>'<HAP1><HAP1-et-2>essentiel</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>selon</HAP1-et-2></HAP1> une <HAP1><HAP1-et-2>source</HAP1-et-2></HAP1> au
<HAP1><HAP1-et-2>ministère</HAP1-et-2></HAP1> de <HAP2>l</HAP2>'intérieur, <HAP2>des</HAP2> <HAP1><HAP1-et-2>ouvriers</HAP1-et-2></HAP1>.

FICHIER 2

§ <MOIS="200605"><JOUR="20060520"><HEURE="2006052012">
<HAP2><HAP1-et-2>Le</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>premier</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>ministre</HAP1-et-2></HAP2> irakien <HAP2><HAP1-et-2>désigné</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>Nouri</HAP1-et-2></HAP2> Al-Maliki, a <HAP2><HAP1-et-2>présenté</HAP1-et-2></HAP2>
samedi 20 mai son gouvernement <HAP2>d</HAP2>'<HAP2><HAP1-et-2>union</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>nationale</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>devant</HAP1-et-2></HAP2> le Parlement
irakien. <HAP2><HAP1-et-2>Pour</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>ne</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>pas</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>repousser</HAP1-et-2></HAP2> davantage <HAP2><HAP1-et-2>cette</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>échéance</HAP1-et-2></HAP2> - <HAP2><HAP1-et-2>déjà</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>reportée</HAP1-et-2></HAP2> par <HAP2><HAP1-et-2>deux</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>fois</HAP1-et-2></HAP2> - <HAP2><HAP1-et-2>M</HAP1-et-2></HAP2>. Al-Maliki a <HAP2><HAP1-et-2>préféré</HAP1-et-2></HAP2> <HAP2>se</HAP2> <HAP2><HAP1-et-2>donner</HAP1-et-2></HAP2> davantage de
<HAP2><HAP1-et-2>temps</HAP1-et-2></HAP2> <HAP2>pour</HAP2> <HAP2><HAP1-et-2>désigner</HAP1-et-2></HAP2> <HAP1>les</HAP1> <HAP2><HAP1-et-2>titulaires</HAP1-et-2></HAP2> <HAP2>des</HAP2> <HAP2><HAP1-et-2>ministères</HAP1-et-2></HAP2> de <HAP2>la</HAP2> <HAP2><HAP1-et-2>défense</HAP1-et-2></HAP2> et de
<HAP2>l</HAP2>'intérieur, <HAP2><HAP1-et-2>sur</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>lesquels</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>aucun</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>accord</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>n</HAP1-et-2></HAP2>'a <HAP2><HAP1-et-2>pu</HAP1-et-2></HAP2> être <HAP2><HAP1-et-2>trouvé</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>entre</HAP1-et-2></HAP2> <HAP1>les</HAP1>
<HAP2><HAP1-et-2>partis</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>sunnites</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>chiites</HAP1-et-2></HAP2> et <HAP2><HAP1-et-2>kurdes</HAP1-et-2></HAP2>.