Vendredi 20 Octobre 2006 22:36:57

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200602"><JOUR="20060214"><HEURE="2006021419">
<HAP1><HAP1-et-2>Plusieurs</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>dizaines</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>milliers</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>militants</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>syndicaux</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>toute</HAP1-et-2></HAP1>
l'Europe 50 000 selon les <HAP1><HAP1-et-2>organisateurs</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>près</HAP1-et-2></HAP1> de 30 000 selon une
<HAP1><HAP1-et-2>première</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>estimation</HAP1-et-2></HAP1> de la <HAP1><HAP1-et-2>police</HAP1-et-2></HAP1> ont <HAP1><HAP1-et-2>manifesté</HAP1-et-2></HAP1>, <HAP1>mardi</HAP1> 14 février, à
<HAP1><HAP1-et-2>Strasbourg</HAP1-et-2></HAP1> contre la directive Bolkestein <HAP1>sur</HAP1> les services.
<HAP1>Les</HAP1> <HAP1><HAP1-et-2>organisations</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>syndicales</HAP1-et-2></HAP1> d'une <HAP1><HAP1-et-2>vingtaine</HAP1-et-2></HAP1> de pays, <HAP2>dont</HAP2> des
nouveaux <HAP2>membres</HAP2> de l'<HAP1><HAP1-et-2>Union</HAP1-et-2></HAP1> <HAP2>européenne</HAP2>, ont <HAP1><HAP1-et-2>trouvé</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>place</HAP1-et-2></HAP1> <HAP2>dans</HAP2> un
<HAP1><HAP1-et-2>cortège</HAP1-et-2></HAP1> très <HAP1><HAP1-et-2>discipliné</HAP1-et-2></HAP1> <HAP2>dont</HAP2> les <HAP1><HAP1-et-2>gros</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>bataillons</HAP1-et-2></HAP1> étaient <HAP1><HAP1-et-2>fournis</HAP1-et-2></HAP1> par
les syndicats <HAP2>français</HAP2> et <HAP1><HAP1-et-2>allemands</HAP1-et-2></HAP1>. En <HAP1><HAP1-et-2>tête</HAP1-et-2></HAP1>, une <HAP2>grande</HAP2> <HAP1><HAP1-et-2>banderole</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>rouge</HAP1-et-2></HAP1> de la <HAP1><HAP1-et-2>Confédération</HAP1-et-2></HAP1> <HAP2>européenne</HAP2> des syndicats (CES) <HAP1><HAP1-et-2>demandait</HAP1-et-2></HAP1>, <HAP2>en</HAP2>
<HAP1><HAP1-et-2>anglais</HAP1-et-2></HAP1>, des "services pour le peuple" et <HAP1><HAP1-et-2>proclamait</HAP1-et-2></HAP1>, <HAP2>en</HAP2> <HAP2>français</HAP2> :
"<HAP1><HAP1-et-2>Il</HAP1-et-2></HAP1> <HAP2>est</HAP2> <HAP1><HAP1-et-2>temps</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>changer</HAP1-et-2></HAP1> la directive".
"<HAP1><HAP1-et-2>Nous</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>manifestons</HAP1-et-2></HAP1> pour des services pour <HAP1><HAP1-et-2>tout</HAP1-et-2></HAP1> le peuple, et <HAP1>pas</HAP1> pour
des services <HAP1><HAP1-et-2>seulement</HAP1-et-2></HAP1> pour <HAP1><HAP1-et-2>gagner</HAP1-et-2></HAP1> de l'<HAP1><HAP1-et-2>argent</HAP1-et-2></HAP1>", a déclaré le
<HAP1><HAP1-et-2>secrétaire</HAP1-et-2></HAP1> général de la CES, <HAP1><HAP1-et-2>John</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>Monks</HAP1-et-2></HAP1>, au <HAP1><HAP1-et-2>premier</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>rang</HAP1-et-2></HAP1> de la
manifestation. "C'<HAP2>est</HAP2> très <HAP1><HAP1-et-2>important</HAP1-et-2></HAP1> <HAP2>que</HAP2> <HAP2>ce</HAP2> <HAP1><HAP1-et-2>message</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>parvienne</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>aujourd</HAP1-et-2></HAP1>'<HAP1><HAP1-et-2>hui</HAP1-et-2></HAP1> au <HAP1>Parlement</HAP1> européen", a-t-il ajouté.
"<HAP1>La</HAP1> <HAP1><HAP1-et-2>tension</HAP1-et-2></HAP1> <HAP2>est</HAP2> toujours <HAP2>grande</HAP2> entre ceux qui <HAP1><HAP1-et-2>défendent</HAP1-et-2></HAP1> une Europe
<HAP1>sociale</HAP1> et ceux qui <HAP1><HAP1-et-2>veulent</HAP1-et-2></HAP1> un <HAP2>marché</HAP2> <HAP1><HAP1-et-2>libéral</HAP1-et-2></HAP1>. <HAP1><HAP1-et-2>Notre</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>but</HAP1-et-2></HAP1> était de
<HAP1><HAP1-et-2>créer</HAP1-et-2></HAP1> un <HAP1><HAP1-et-2>barrage</HAP1-et-2></HAP1> entre <HAP2>ce</HAP2> <HAP1><HAP1-et-2>libéralisme</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>excessif</HAP1-et-2></HAP1>, contre cette <HAP1><HAP1-et-2>foi</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>quasi</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>religieuse</HAP1-et-2></HAP1> <HAP2>dans</HAP2> le <HAP1><HAP1-et-2>pouvoir</HAP1-et-2></HAP1> du <HAP2>marché</HAP2> <HAP1><HAP1-et-2>libre</HAP1-et-2></HAP1>", a <HAP1><HAP1-et-2>encore</HAP1-et-2></HAP1> déclaré
le <HAP1><HAP1-et-2>leader</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>syndical</HAP1-et-2></HAP1> européen à la <HAP1><HAP1-et-2>radio</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>BFM</HAP1-et-2></HAP1>. "<HAP1>Le</HAP1> principe du pays
d'origine était <HAP1><HAP1-et-2>vraiment</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>inquiétant</HAP1-et-2></HAP1> (...). C'était de la <HAP1><HAP1-et-2>dynamite</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>pure</HAP1-et-2></HAP1> pour les <HAP1><HAP1-et-2>relations</HAP1-et-2></HAP1> entre les Etats <HAP2>membres</HAP2> et les <HAP1><HAP1-et-2>travailleurs</HAP1-et-2></HAP1>",
a-t-il ajouté.
En <HAP1><HAP1-et-2>dépit</HAP1-et-2></HAP1> du <HAP1>compromis</HAP1> <HAP1><HAP1-et-2>négocié</HAP1-et-2></HAP1> par leur <HAP1>groupe</HAP1>, les <HAP1><HAP1-et-2>députés</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>européens</HAP1-et-2></HAP1>
du <HAP1>Parti</HAP1> socialiste <HAP2>français</HAP2> ont <HAP1><HAP1-et-2>participé</HAP1-et-2></HAP1> à la manifestation. <HAP1><HAP1-et-2>Pour</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>eux</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>bien</HAP1-et-2></HAP1> <HAP2>que</HAP2> "<HAP1><HAP1-et-2>formellement</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>retiré</HAP1-et-2></HAP1> de la directive", le principe du
pays d'origine "<HAP1><HAP1-et-2>demeure</HAP1-et-2></HAP1> la <HAP1><HAP1-et-2>clé</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>voûte</HAP1-et-2></HAP1> de la <HAP1><HAP1-et-2>stratégie</HAP1-et-2></HAP1> de la
Commission <HAP2>européenne</HAP2>".

FICHIER 2

§ <MOIS="200602"><JOUR="20060215"><HEURE="2006021508">
<HAP1>Le</HAP1> <HAP1>Parlement</HAP1> européen a fait un <HAP2><HAP1-et-2>grand</HAP1-et-2></HAP2> <HAP1>pas</HAP1> <HAP2><HAP1-et-2>vers</HAP1-et-2></HAP2> l'<HAP2><HAP1-et-2>adoption</HAP1-et-2></HAP2> de la
directive Bolkestein <HAP2><HAP1-et-2>après</HAP1-et-2></HAP2> <HAP2>que</HAP2> les deux <HAP2><HAP1-et-2>principaux</HAP1-et-2></HAP2> groupes du
<HAP1>Parlement</HAP1> européen ont <HAP2><HAP1-et-2>réussi</HAP1-et-2></HAP2> à <HAP2><HAP1-et-2>applanir</HAP1-et-2></HAP2>, <HAP1>mardi</HAP1> 14 février,
l'<HAP2><HAP1-et-2>essentiel</HAP1-et-2></HAP2> des leurs <HAP2><HAP1-et-2>différends</HAP1-et-2></HAP2> <HAP1>sur</HAP1> <HAP2>ce</HAP2> <HAP2><HAP1-et-2>texte</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>A</HAP1-et-2></HAP2> l'<HAP2><HAP1-et-2>issue</HAP1-et-2></HAP2> d'une <HAP2><HAP1-et-2>réunion</HAP1-et-2></HAP2>
de <HAP1>groupe</HAP1> <HAP1>mardi</HAP1> soir, le <HAP2><HAP1-et-2>chef</HAP1-et-2></HAP2> du <HAP1>Parti</HAP1> <HAP2><HAP1-et-2>populaire</HAP1-et-2></HAP2> européen (PPE,
droite), <HAP2><HAP1-et-2>Hans</HAP1-et-2></HAP2>-<HAP2><HAP1-et-2>Gert</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Poettering</HAP1-et-2></HAP2>, a <HAP2><HAP1-et-2>appelé</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>ses</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>troupes</HAP1-et-2></HAP2> à "accepter le
<HAP1>compromis</HAP1>" conclu avec le <HAP1>Parti</HAP1> socialiste européen (PSE). <HAP2><HAP1-et-2>Et</HAP1-et-2></HAP2> une
"<HAP2>grande</HAP2> majorité du PSE", <HAP2>dont</HAP2> les élus se <HAP2><HAP1-et-2>réunissaient</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>aussi</HAP1-et-2></HAP2> <HAP1>mardi</HAP1>
soir, <HAP2>est</HAP2> <HAP2><HAP1-et-2>également</HAP1-et-2></HAP2> prête à <HAP2><HAP1-et-2>voter</HAP1-et-2></HAP2> cette <HAP2><HAP1-et-2>version</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>modifiée</HAP1-et-2></HAP2> du <HAP1>compromis</HAP1>,
a <HAP2><HAP1-et-2>indiqué</HAP1-et-2></HAP2> un <HAP2><HAP1-et-2>porte</HAP1-et-2></HAP2>-<HAP2><HAP1-et-2>parole</HAP1-et-2></HAP2> du <HAP1>groupe</HAP1>.
<HAP1>Les</HAP1> élus conservateurs des nouveaux Etats <HAP2>membres</HAP2> étaient <HAP2><HAP1-et-2>parmi</HAP1-et-2></HAP2> les
<HAP2><HAP1-et-2>plus</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>réticents</HAP1-et-2></HAP2> à accepter le <HAP1>compromis</HAP1> conclu la <HAP2><HAP1-et-2>semaine</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>dernière</HAP1-et-2></HAP2> par
les <HAP2><HAP1-et-2>équipes</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>négociation</HAP1-et-2></HAP2> du PPE et du PSE, <HAP2><HAP1-et-2>jugeant</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>celui</HAP1-et-2></HAP2>-<HAP2><HAP1-et-2>ci</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>trop</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>protectionniste</HAP1-et-2></HAP2>, notamment à <HAP2><HAP1-et-2>cause</HAP1-et-2></HAP2> des <HAP2><HAP1-et-2>restrictions</HAP1-et-2></HAP2> d'<HAP2><HAP1-et-2>accès</HAP1-et-2></HAP2> au <HAP2>marché</HAP2>
toujours <HAP2><HAP1-et-2>possibles</HAP1-et-2></HAP2> au <HAP2><HAP1-et-2>nom</HAP1-et-2></HAP2> de la politique <HAP1>sociale</HAP1> et de la protection
des consommateurs. <HAP2><HAP1-et-2>Selon</HAP1-et-2></HAP2> des <HAP2><HAP1-et-2>sources</HAP1-et-2></HAP2> des deux groupes, <HAP2><HAP1-et-2>ces</HAP1-et-2></HAP2> deux
<HAP2><HAP1-et-2>mentions</HAP1-et-2></HAP2> ont <HAP2><HAP1-et-2>été</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>retirées</HAP1-et-2></HAP2> avec l'accord des socialistes qui <HAP2><HAP1-et-2>estiment</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>avoir</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>suffisamment</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>garanties</HAP1-et-2></HAP2> <HAP2>en</HAP2> <HAP2><HAP1-et-2>matière</HAP1-et-2></HAP2> de protection des
consommateurs et de politique <HAP1>sociale</HAP1>.
<HAP1>Le</HAP1> <HAP1>compromis</HAP1> ne fait <HAP2><HAP1-et-2>toutefois</HAP1-et-2></HAP2> <HAP1>pas</HAP1> l'<HAP2><HAP1-et-2>unanimité</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Malgré</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>tous</HAP1-et-2></HAP2> leurs
<HAP2><HAP1-et-2>efforts</HAP1-et-2></HAP2>, socialistes et conservateurs ne sont <HAP1>pas</HAP1> <HAP2><HAP1-et-2>parvenus</HAP1-et-2></HAP2> à se <HAP2><HAP1-et-2>mettre</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>complètement</HAP1-et-2></HAP2> d'accord <HAP1>sur</HAP1> le <HAP2><HAP1-et-2>champ</HAP1-et-2></HAP2> d'<HAP2><HAP1-et-2>application</HAP1-et-2></HAP2> de la directive. <HAP1>Les</HAP1>
socialistes <HAP2><HAP1-et-2>demandent</HAP1-et-2></HAP2> notamment <HAP2><HAP1-et-2>qu</HAP1-et-2></HAP2>'<HAP2><HAP1-et-2>elle</HAP1-et-2></HAP2> ne <HAP2><HAP1-et-2>couvre</HAP1-et-2></HAP2> <HAP1>pas</HAP1> les services
d'<HAP2><HAP1-et-2>intérêt</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>économique</HAP1-et-2></HAP2> général (services <HAP2><HAP1-et-2>publics</HAP1-et-2></HAP2> qui <HAP2><HAP1-et-2>peuvent</HAP1-et-2></HAP2> être
<HAP2><HAP1-et-2>assurés</HAP1-et-2></HAP2> par le <HAP2><HAP1-et-2>privé</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>comme</HAP1-et-2></HAP2> la <HAP2><HAP1-et-2>distribution</HAP1-et-2></HAP2> d'<HAP2><HAP1-et-2>eau</HAP1-et-2></HAP2>). <HAP1>La</HAP1> droite <HAP2><HAP1-et-2>refuse</HAP1-et-2></HAP2>
leur <HAP2><HAP1-et-2>exclusion</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>L</HAP1-et-2></HAP2>'<HAP2><HAP1-et-2>eurodéputé</HAP1-et-2></HAP2> <HAP2>français</HAP2> <HAP2><HAP1-et-2>Jacques</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Toubon</HAP1-et-2></HAP2> (<HAP2><HAP1-et-2>UMP</HAP1-et-2></HAP2>, droite)
<HAP2><HAP1-et-2>s</HAP1-et-2></HAP2>'<HAP2><HAP1-et-2>attend</HAP1-et-2></HAP2> à des <HAP2><HAP1-et-2>votes</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>dissidents</HAP1-et-2></HAP2> <HAP2>dans</HAP2> les deux <HAP2><HAP1-et-2>camps</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>jeudi</HAP1-et-2></HAP2>.
<HAP1>La</HAP1> Commission <HAP2>européenne</HAP2> a <HAP2><HAP1-et-2>annoncé</HAP1-et-2></HAP2> <HAP1>mardi</HAP1> être prête à <HAP2><HAP1-et-2>modifier</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>rapidement</HAP1-et-2></HAP2> la directive, <HAP2><HAP1-et-2>si</HAP1-et-2></HAP2> les <HAP2><HAP1-et-2>amendements</HAP1-et-2></HAP2> de <HAP1>compromis</HAP1> sont <HAP2><HAP1-et-2>adoptés</HAP1-et-2></HAP2>
"à une <HAP2><HAP1-et-2>large</HAP1-et-2></HAP2> majorité".