Vendredi 20 Octobre 2006 22:38:12

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200602"><JOUR="20060228"><HEURE="2006022819">
L'actuel <HAP2>PDG</HAP2> de Suez, <HAP2>Gérard</HAP2> <HAP2>Mestrallet</HAP2>, <HAP2>sera</HAP2> numéro un du <HAP2>nouveau</HAP2>
<HAP2>groupe</HAP2> issu de <HAP2>la</HAP2> <HAP2>fusion</HAP2> entre Suez <HAP2>et</HAP2> Gaz de France. Son homologue de
<HAP2>GDF</HAP2>, Jean-François Cirelli, deviendra numéro deux du "tandem". Cette
annonce <HAP2>a</HAP2> été faite par <HAP2>les</HAP2> deux patrons lors <HAP2>d</HAP2>'<HAP2>une</HAP2> conférence
commune, <HAP2>mardi</HAP2> 28 février <HAP2>à</HAP2> 15 heures, <HAP2>dans</HAP2> un hôtel parisien.
A <HAP1><HAP1-et-2>cette</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>occasion</HAP1-et-2></HAP1>, <HAP2>les</HAP2> deux dirigeants ont <HAP1><HAP1-et-2>détaillé</HAP1-et-2></HAP1> le "<HAP1><HAP1-et-2>calendrier</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>indicatif</HAP1-et-2></HAP1>" du <HAP1><HAP1-et-2>processus</HAP1-et-2></HAP1> de <HAP2>fusion</HAP2>. Le projet <HAP2>sera</HAP2> <HAP1><HAP1-et-2>soumis</HAP1-et-2></HAP1> <HAP2>à</HAP2> <HAP2>la</HAP2>
<HAP1><HAP1-et-2>Commission</HAP1-et-2></HAP1> européenne <HAP1><HAP1-et-2>en</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>avril</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>afin</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>déterminer</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>s</HAP1-et-2></HAP1>'il y <HAP2>a</HAP2> <HAP1><HAP1-et-2>lieu</HAP1-et-2></HAP1> ou
pas de <HAP1><HAP1-et-2>procéder</HAP1-et-2></HAP1> <HAP2>à</HAP2> des <HAP1><HAP1-et-2>cessions</HAP1-et-2></HAP1> pour se <HAP1><HAP1-et-2>conformer</HAP1-et-2></HAP1> <HAP2>à</HAP2> <HAP2>la</HAP2> <HAP1><HAP1-et-2>réglementation</HAP1-et-2></HAP1>
européenne sur <HAP2>la</HAP2> <HAP1><HAP1-et-2>concurrence</HAP1-et-2></HAP1>. <HAP1><HAP1-et-2>La</HAP1-et-2></HAP1> <HAP2>fusion</HAP2> <HAP2>sera</HAP2> <HAP1><HAP1-et-2>ensuite</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>soumise</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>aux</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>assemblées</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>générales</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>extraordinaires</HAP1-et-2></HAP1> des deux groupes <HAP2>à</HAP2> <HAP2>la</HAP2>
<HAP1><HAP1-et-2>mi</HAP1-et-2></HAP1>-décembre.
<HAP2>Gérard</HAP2> <HAP2>Mestrallet</HAP2> <HAP2>a</HAP2> <HAP1><HAP1-et-2>refusé</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>présenter</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>ce</HAP1-et-2></HAP1> projet <HAP1><HAP1-et-2>comme</HAP1-et-2></HAP1> un "projet de
<HAP1><HAP1-et-2>réaction</HAP1-et-2></HAP1>". Il <HAP2>a</HAP2> indiqué que le projet de <HAP2>fusion</HAP2> <HAP2>GDF</HAP2>-Suez <HAP1><HAP1-et-2>était</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>déjà</HAP1-et-2></HAP1>
"<HAP1><HAP1-et-2>largement</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>avancé</HAP1-et-2></HAP1>" <HAP1><HAP1-et-2>lorsque</HAP1-et-2></HAP1> Enel <HAP2>a</HAP2> <HAP1><HAP1-et-2>manifesté</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>son</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>intérêt</HAP1-et-2></HAP1> pour
<HAP1><HAP1-et-2>Electrabel</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>puis</HAP1-et-2></HAP1> Suez. "<HAP1><HAP1-et-2>Cela</HAP1-et-2></HAP1> <HAP2>a</HAP2> <HAP1><HAP1-et-2>conduit</HAP1-et-2></HAP1> <HAP2>à</HAP2> <HAP2>une</HAP2> <HAP1><HAP1-et-2>accélération</HAP1-et-2></HAP1>, il <HAP1><HAP1-et-2>faut</HAP1-et-2></HAP1> le
<HAP1><HAP1-et-2>reconnaître</HAP1-et-2></HAP1>", <HAP2>a</HAP2> <HAP1><HAP1-et-2>toutefois</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>concédé</HAP1-et-2></HAP1> M. <HAP2>Mestrallet</HAP2>. Le <HAP2>PDG</HAP2> de Suez <HAP2>a</HAP2>
affirmé, <HAP2>mardi</HAP2>, qu'il n'<HAP1><HAP1-et-2>avait</HAP1-et-2></HAP1> "<HAP1><HAP1-et-2>jamais</HAP1-et-2></HAP1>" <HAP1><HAP1-et-2>eu</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>contacts</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>avec</HAP1-et-2></HAP1> <HAP2>les</HAP2>
dirigeants du <HAP2>groupe</HAP2> <HAP1><HAP1-et-2>italien</HAP1-et-2></HAP1> <HAP2>d</HAP2>'<HAP1><HAP1-et-2>électricité</HAP1-et-2></HAP1> Enel. "<HAP1><HAP1-et-2>Je</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>ne</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>connais</HAP1-et-2></HAP1> pas M.
<HAP1><HAP1-et-2>Conti</HAP1-et-2></HAP1> (<HAP1><HAP1-et-2>administrateur</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>délégué</HAP1-et-2></HAP1> <HAP2>d</HAP2>'Enel), <HAP1><HAP1-et-2>je</HAP1-et-2></HAP1> n'<HAP1><HAP1-et-2>ai</HAP1-et-2></HAP1> pas le <HAP1><HAP1-et-2>plaisir</HAP1-et-2></HAP1> de
<HAP1><HAP1-et-2>connaître</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>sa</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>voix</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>même</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>au</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>téléphone</HAP1-et-2></HAP1>", <HAP2>a</HAP2> affirmé le <HAP2>PDG</HAP2> de Suez. "Il
n'y <HAP2>a</HAP2> pas de projet Enel pour <HAP1><HAP1-et-2>moi</HAP1-et-2></HAP1>", <HAP2>a</HAP2>-t-il dit <HAP1><HAP1-et-2>ajouté</HAP1-et-2></HAP1>.
<HAP1><HAP1-et-2>Prié</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>dire</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>si</HAP1-et-2></HAP1> Enel <HAP1><HAP1-et-2>pouvait</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>surenchérir</HAP1-et-2></HAP1> sur Suez, il <HAP2>a</HAP2> <HAP1><HAP1-et-2>répondu</HAP1-et-2></HAP1> : "<HAP1><HAP1-et-2>Si</HAP1-et-2></HAP1>
Enel <HAP1><HAP1-et-2>attaque</HAP1-et-2></HAP1>, on se <HAP1><HAP1-et-2>défend</HAP1-et-2></HAP1>. Enel ou <HAP1><HAP1-et-2>quiconque</HAP1-et-2></HAP1>". "<HAP1><HAP1-et-2>Ce</HAP1-et-2></HAP1> projet, on <HAP1><HAP1-et-2>veut</HAP1-et-2></HAP1> le
réaliser, on <HAP1><HAP1-et-2>va</HAP1-et-2></HAP1> le réaliser. <HAP1><HAP1-et-2>On</HAP1-et-2></HAP1> se <HAP1><HAP1-et-2>battra</HAP1-et-2></HAP1> <HAP2>et</HAP2> on <HAP1><HAP1-et-2>montrera</HAP1-et-2></HAP1> qu'il n'y <HAP2>a</HAP2>
pas <HAP2>d</HAP2>'<HAP1><HAP1-et-2>autre</HAP1-et-2></HAP1> projet <HAP1><HAP1-et-2>plus</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>créateur</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>valeur</HAP1-et-2></HAP1> pour <HAP1><HAP1-et-2>nos</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>actionnaires</HAP1-et-2></HAP1>",
<HAP2>a</HAP2>-t-il <HAP1><HAP1-et-2>encore</HAP1-et-2></HAP1> dit.
<HAP1><HAP1-et-2>Les</HAP1-et-2></HAP1> deux <HAP2>PDG</HAP2> ont <HAP1><HAP1-et-2>répété</HAP1-et-2></HAP1> que <HAP2>la</HAP2> <HAP2>fusion</HAP2> serait <HAP1><HAP1-et-2>créatrice</HAP1-et-2></HAP1> <HAP2>d</HAP2>'<HAP1><HAP1-et-2>emplois</HAP1-et-2></HAP1> <HAP2>et</HAP2>
que <HAP2>la</HAP2> <HAP1><HAP1-et-2>culture</HAP1-et-2></HAP1> des deux groupes serait <HAP1><HAP1-et-2>respectée</HAP1-et-2></HAP1>. <HAP1><HAP1-et-2>En</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>outre</HAP1-et-2></HAP1>, M.
<HAP2>Mestrallet</HAP2> <HAP2>a</HAP2> indiqué que le <HAP2>nouveau</HAP2> <HAP2>groupe</HAP2> <HAP1><HAP1-et-2>garderait</HAP1-et-2></HAP1> le <HAP1><HAP1-et-2>pôle</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>eau</HAP1-et-2></HAP1> <HAP2>et</HAP2>
<HAP1><HAP1-et-2>environnement</HAP1-et-2></HAP1> de Suez, <HAP1><HAP1-et-2>dont</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>certains</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>analystes</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>estimaient</HAP1-et-2></HAP1> qu'il
<HAP1><HAP1-et-2>pourrait</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>être</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>cédé</HAP1-et-2></HAP1>.
(A <HAP1><HAP1-et-2>lire</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>aussi</HAP1-et-2></HAP1>, le <HAP1><HAP1-et-2>portrait</HAP1-et-2></HAP1> de <HAP2>Gérard</HAP2> <HAP2>Mestrallet</HAP2> <HAP1><HAP1-et-2>publié</HAP1-et-2></HAP1> <HAP2>dans</HAP2> Le <HAP1><HAP1-et-2>Monde</HAP1-et-2></HAP1>
du 16 décembre 2005.)

FICHIER 2

§ <MOIS="200603"><JOUR="20060302"><HEURE="2006030211">
L'actuel <HAP2>PDG</HAP2> de Suez, <HAP2>Gérard</HAP2> <HAP2>Mestrallet</HAP2>, <HAP2>sera</HAP2> numéro un du <HAP2>nouveau</HAP2>
<HAP2>groupe</HAP2> issu de <HAP2>la</HAP2> <HAP2>fusion</HAP2> entre Suez <HAP2>et</HAP2> Gaz de France. Son homologue de
<HAP2>GDF</HAP2>, Jean-François Cirelli, deviendra numéro deux du "tandem". Cette
annonce <HAP2>a</HAP2> été faite par <HAP2>les</HAP2> deux patrons lors <HAP2>d</HAP2>'<HAP2>une</HAP2> conférence
commune, <HAP2>mardi</HAP2> 28 février <HAP2>à</HAP2> 15 heures, <HAP2>dans</HAP2> un hôtel parisien.