Vendredi 20 Octobre 2006 22:37:47

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200602"><JOUR="20060204"><HEURE="2006020408">
<HAP1>La</HAP1> <HAP1>publication</HAP1> de <HAP1>caricatures</HAP1> de Mahomet dans la presse de <HAP1>plusieurs</HAP1>
<HAP1>pays</HAP1> <HAP1>européens</HAP1> <HAP1>a</HAP1> décuplé la colère des <HAP1>musulmans</HAP1>, <HAP1>qui</HAP1> ont encore
manifesté par milliers dans <HAP1>le</HAP1> monde, de Gaza à <HAP1>l</HAP1>'Indonésie. Face à <HAP1>ce</HAP1>
tollé, la <HAP1>France</HAP1>, la <HAP1>Grande</HAP1>-<HAP1>Bretagne</HAP1> et les <HAP1>Etats</HAP1>-<HAP1>Unis</HAP1> ont <HAP1>appelé</HAP1>,
<HAP1>vendredi</HAP1> 3 février, à <HAP1>plus</HAP1> de <HAP1>responsabilité</HAP1> et de <HAP1>respect</HAP1> envers les
sentiments religieux, mettant, à des degrés divers, <HAP1>un</HAP1> bémol à leurs
discours sur la défense de la <HAP1>liberté</HAP1> de la presse alors <HAP1>que</HAP1> les
autorités de <HAP1>Copenhague</HAP1> <HAP1>sont</HAP1> restées fermes sur leurs <HAP1>positions</HAP1>.

FICHIER 2

§ <MOIS="200602"><JOUR="20060204"><HEURE="2006020410">
<HAP1>La</HAP1> <HAP1>publication</HAP1> de <HAP1>caricatures</HAP1> de Mahomet dans la presse de <HAP1>plusieurs</HAP1>
<HAP1>pays</HAP1> <HAP1>européens</HAP1> <HAP1>a</HAP1> décuplé la colère des <HAP1>musulmans</HAP1>, <HAP1>qui</HAP1> ont encore
manifesté par milliers dans <HAP1>le</HAP1> monde, de Gaza à <HAP1>l</HAP1>'Indonésie. Face à <HAP1>ce</HAP1>
tollé, la <HAP1>France</HAP1>, la <HAP1>Grande</HAP1>-<HAP1>Bretagne</HAP1> et les <HAP1>Etats</HAP1>-<HAP1>Unis</HAP1> ont <HAP1>appelé</HAP1>,
<HAP1>vendredi</HAP1> 3 février, à <HAP1>plus</HAP1> de <HAP1>responsabilité</HAP1> et de <HAP1>respect</HAP1> envers les
sentiments religieux, mettant, à des degrés divers, <HAP1>un</HAP1> bémol à leurs
discours sur la défense de la <HAP1>liberté</HAP1> de la presse alors <HAP1>que</HAP1> les
autorités de <HAP1>Copenhague</HAP1> <HAP1>sont</HAP1> restées fermes sur leurs <HAP1>positions</HAP1>.
<HAP2><HAP1-et-2>A</HAP1-et-2></HAP2> <HAP1>l</HAP1>'<HAP2><HAP1-et-2>occasion</HAP1-et-2></HAP2> d'<HAP1>un</HAP1> <HAP2><HAP1-et-2>entretien</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>avec</HAP1-et-2></HAP2> <HAP1>le</HAP1> <HAP2><HAP1-et-2>recteur</HAP1-et-2></HAP2> de la <HAP2><HAP1-et-2>Mosquée</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>Paris</HAP1-et-2></HAP2>,
<HAP2><HAP1-et-2>Dalil</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Boubakeur</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>Jacques</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Chirac</HAP1-et-2></HAP2> "<HAP1>a</HAP1> rappelé <HAP1>que</HAP1> la <HAP1>France</HAP1>, <HAP1>pays</HAP1> de
<HAP2><HAP1-et-2>laïcité</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>respecte</HAP1-et-2></HAP2> toutes les <HAP2><HAP1-et-2>religions</HAP1-et-2></HAP2> et toutes les croyances",
selon <HAP1>un</HAP1> <HAP2><HAP1-et-2>communiqué</HAP1-et-2></HAP2> de <HAP1>l</HAP1>'<HAP2><HAP1-et-2>Elysée</HAP1-et-2></HAP2>. "Il <HAP1>a</HAP1> également rappelé <HAP1>que</HAP1> <HAP1>le</HAP1>
<HAP2><HAP1-et-2>principe</HAP1-et-2></HAP2> de la <HAP1>liberté</HAP1> d'expression <HAP2><HAP1-et-2>constitue</HAP1-et-2></HAP2> <HAP1>un</HAP1> des <HAP2><HAP1-et-2>fondements</HAP1-et-2></HAP2> de la
République." Le <HAP2><HAP1-et-2>président</HAP1-et-2></HAP2> de la République "<HAP2><HAP1-et-2>appelle</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>donc</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>chacun</HAP1-et-2></HAP2> au
<HAP1>plus</HAP1> <HAP2><HAP1-et-2>grand</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>esprit</HAP1-et-2></HAP2> de <HAP1>responsabilité</HAP1>, de <HAP1>respect</HAP1> et de <HAP2><HAP1-et-2>mesure</HAP1-et-2></HAP2> pour
<HAP2><HAP1-et-2>éviter</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>tout</HAP1-et-2></HAP2> <HAP1>ce</HAP1> <HAP1>qui</HAP1> peut <HAP2><HAP1-et-2>blesser</HAP1-et-2></HAP2> les <HAP2><HAP1-et-2>convictions</HAP1-et-2></HAP2> d'<HAP2><HAP1-et-2>autrui</HAP1-et-2></HAP2>", selon la
<HAP2><HAP1-et-2>même</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>source</HAP1-et-2></HAP2>.
<HAP1>La</HAP1> presse <HAP2><HAP1-et-2>française</HAP1-et-2></HAP2> ne s'est pas <HAP2><HAP1-et-2>censurée</HAP1-et-2></HAP2> dans <HAP2><HAP1-et-2>cette</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>affaire</HAP1-et-2></HAP2>.
<HAP2><HAP1-et-2>Plusieurs</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>quotidiens</HAP1-et-2></HAP2> ont <HAP2><HAP1-et-2>reproduit</HAP1-et-2></HAP2> les <HAP1>caricatures</HAP1> publiées d'<HAP2><HAP1-et-2>abord</HAP1-et-2></HAP2>
dans <HAP1>un</HAP1> <HAP2><HAP1-et-2>quotidien</HAP1-et-2></HAP2> danois, <HAP2><HAP1-et-2>notamment</HAP1-et-2></HAP2> <HAP1>France</HAP1> <HAP2><HAP1-et-2>Soir</HAP1-et-2></HAP2> et <HAP2><HAP1-et-2>Libération</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Des</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>hebdomadaires</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>comme</HAP1-et-2></HAP2> Le <HAP2><HAP1-et-2>Nouvel</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Observateur</HAP1-et-2></HAP2> ou <HAP2><HAP1-et-2>Charlie</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Hebdo</HAP1-et-2></HAP2> ont publié
ces <HAP1>caricatures</HAP1> ou <HAP2><HAP1-et-2>vont</HAP1-et-2></HAP2> <HAP1>le</HAP1> <HAP2><HAP1-et-2>faire</HAP1-et-2></HAP2>.
<HAP2><HAP1-et-2>De</HAP1-et-2></HAP2> <HAP1>l</HAP1>'<HAP2><HAP1-et-2>autre</HAP1-et-2></HAP2> côté de la <HAP2><HAP1-et-2>Manche</HAP1-et-2></HAP2>, la <HAP2><HAP1-et-2>prudence</HAP1-et-2></HAP2> est de <HAP2><HAP1-et-2>mise</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>tant</HAP1-et-2></HAP2> du côté du
<HAP2><HAP1-et-2>pouvoir</HAP1-et-2></HAP2> <HAP1>que</HAP1> de la presse. <HAP1>La</HAP1> <HAP1>Grande</HAP1>-<HAP1>Bretagne</HAP1> s'est <HAP2><HAP1-et-2>désolidarisée</HAP1-et-2></HAP2> des
<HAP1>pays</HAP1> <HAP2><HAP1-et-2></HAP1-et-2></HAP2> les <HAP1>caricatures</HAP1> ont été publiées, jugeant <HAP1>que</HAP1> <HAP2><HAP1-et-2>cela</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>témoignait</HAP1-et-2></HAP2>
d'<HAP1>un</HAP1> "manque de <HAP1>respect</HAP1>". "<HAP2><HAP1-et-2>Je</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>pense</HAP1-et-2></HAP2> <HAP1>que</HAP1> la <HAP2><HAP1-et-2>nouvelle</HAP1-et-2></HAP2> <HAP1>publication</HAP1> de ces
<HAP1>caricatures</HAP1> n'<HAP2><HAP1-et-2>était</HAP1-et-2></HAP2> pas <HAP2><HAP1-et-2>nécessaire</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Elle</HAP1-et-2></HAP2> <HAP1>a</HAP1> été <HAP2><HAP1-et-2>indélicate</HAP1-et-2></HAP2> et <HAP2><HAP1-et-2>témoigne</HAP1-et-2></HAP2>
d'<HAP1>un</HAP1> manque de <HAP1>respect</HAP1>", <HAP1>a</HAP1> <HAP2><HAP1-et-2>estimé</HAP1-et-2></HAP2> <HAP1>le</HAP1> ministre des <HAP2><HAP1-et-2>affaires</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>étrangères</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>britannique</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>Jack</HAP1-et-2></HAP2> Straw, <HAP1>qui</HAP1> <HAP2><HAP1-et-2>juge</HAP1-et-2></HAP2> <HAP1>que</HAP1> les journaux "ont <HAP2><HAP1-et-2>eu</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>tort</HAP1-et-2></HAP2>". "Il
y <HAP1>a</HAP1> la <HAP1>liberté</HAP1> de la presse, nous la respectons tous. <HAP2><HAP1-et-2>Mais</HAP1-et-2></HAP2> il n'y <HAP1>a</HAP1>
pas d'<HAP2><HAP1-et-2>obligation</HAP1-et-2></HAP2> d'<HAP2><HAP1-et-2>insulter</HAP1-et-2></HAP2> ou d'<HAP2><HAP1-et-2>être</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>gratuitement</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>incendiaire</HAP1-et-2></HAP2>",
<HAP1>a</HAP1>-t-il ajouté. M. Straw <HAP1>a</HAP1> <HAP2><HAP1-et-2>rendu</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>hommage</HAP1-et-2></HAP2> à la "<HAP1>responsabilité</HAP1>" et à la
"<HAP2><HAP1-et-2>délicatesse</HAP1-et-2></HAP2>" des médias <HAP2><HAP1-et-2>britanniques</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>dont</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>aucun</HAP1-et-2></HAP2> n'<HAP1>a</HAP1> publié les
<HAP2><HAP1-et-2>images</HAP1-et-2></HAP2>, à <HAP1>l</HAP1>'<HAP2><HAP1-et-2>exception</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>très</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>courts</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>passages</HAP1-et-2></HAP2> dans des journaux
<HAP2><HAP1-et-2>télévisés</HAP1-et-2></HAP2> de la <HAP2><HAP1-et-2>BBC</HAP1-et-2></HAP2> et de <HAP2><HAP1-et-2>Channel</HAP1-et-2></HAP2> 4 <HAP2><HAP1-et-2>jeudi</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>L</HAP1-et-2></HAP2>'<HAP2><HAP1-et-2>Association</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>musulmane</HAP1-et-2></HAP2> de
<HAP1>Grande</HAP1>-<HAP1>Bretagne</HAP1> <HAP2><HAP1-et-2>avait</HAP1-et-2></HAP2> <HAP1>appelé</HAP1> les médias à ne pas reproduire ces
<HAP1>caricatures</HAP1>, <HAP2><HAP1-et-2>arguant</HAP1-et-2></HAP2> de leur <HAP2><HAP1-et-2>caractère</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>offensant</HAP1-et-2></HAP2> pour les <HAP1>musulmans</HAP1>.
"<HAP2><HAP1-et-2>CARICATURES</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>BLESSANTES</HAP1-et-2></HAP2>"
<HAP2><HAP1-et-2>Partenaire</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>privilégié</HAP1-et-2></HAP2> de la <HAP1>Grande</HAP1>-<HAP1>Bretagne</HAP1>, les <HAP1>Etats</HAP1>-<HAP1>Unis</HAP1> ont
également <HAP2><HAP1-et-2>condamné</HAP1-et-2></HAP2> ces <HAP2><HAP1-et-2>dessins</HAP1-et-2></HAP2>. "<HAP2><HAP1-et-2>Ces</HAP1-et-2></HAP2> <HAP1>caricatures</HAP1> <HAP1>sont</HAP1> <HAP2><HAP1-et-2>évidemment</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>blessantes</HAP1-et-2></HAP2> pour les croyances des <HAP1>musulmans</HAP1>", <HAP1>a</HAP1> <HAP2><HAP1-et-2>déclaré</HAP1-et-2></HAP2> <HAP1>le</HAP1>
<HAP2><HAP1-et-2>porte</HAP1-et-2></HAP2>-<HAP2><HAP1-et-2>parole</HAP1-et-2></HAP2> du <HAP2><HAP1-et-2>département</HAP1-et-2></HAP2> d'<HAP2><HAP1-et-2>Etat</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>Justin</HAP1-et-2></HAP2> Higgins, en jugeant <HAP1>que</HAP1>
"<HAP1>l</HAP1>'<HAP2><HAP1-et-2>incitation</HAP1-et-2></HAP2> à la <HAP2><HAP1-et-2>haine</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>religieuse</HAP1-et-2></HAP2> et <HAP2><HAP1-et-2>ethnique</HAP1-et-2></HAP2> n'est pas <HAP2><HAP1-et-2>acceptable</HAP1-et-2></HAP2>".
"Nous <HAP2><HAP1-et-2>appelons</HAP1-et-2></HAP2> à la <HAP2><HAP1-et-2>tolérance</HAP1-et-2></HAP2> et au <HAP1>respect</HAP1> de toutes les <HAP2><HAP1-et-2>communautés</HAP1-et-2></HAP2>,
de leurs croyances <HAP2><HAP1-et-2>religieuses</HAP1-et-2></HAP2> et de leurs <HAP2><HAP1-et-2>pratiques</HAP1-et-2></HAP2>", <HAP1>a</HAP1>-t-il <HAP2><HAP1-et-2>dit</HAP1-et-2></HAP2>.
"Nous <HAP2><HAP1-et-2>reconnaissons</HAP1-et-2></HAP2> tous et nous respectons <HAP2><HAP1-et-2>complètement</HAP1-et-2></HAP2> la <HAP1>liberté</HAP1>
de la presse et de <HAP1>l</HAP1>'expression, mais <HAP2><HAP1-et-2>elle</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>doit</HAP1-et-2></HAP2> s'<HAP2><HAP1-et-2>accompagner</HAP1-et-2></HAP2> de la
<HAP1>responsabilité</HAP1> de la presse", <HAP1>a</HAP1> ajouté M. Higgins. <HAP2><HAP1-et-2>Les</HAP1-et-2></HAP2> médias
<HAP2><HAP1-et-2>américains</HAP1-et-2></HAP2> ont, dans leur <HAP2><HAP1-et-2>grande</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>majorité</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>évité</HAP1-et-2></HAP2> de reproduire les
<HAP1>caricatures</HAP1> <HAP2><HAP1-et-2>controversées</HAP1-et-2></HAP2>, en <HAP2><HAP1-et-2>faisant</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>valoir</HAP1-et-2></HAP2> leur <HAP2><HAP1-et-2>nature</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>potentiellement</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>blessante</HAP1-et-2></HAP2>, mais ont <HAP2><HAP1-et-2>commencé</HAP1-et-2></HAP2> d'<HAP2><HAP1-et-2>ouvrir</HAP1-et-2></HAP2> <HAP1>le</HAP1> <HAP2><HAP1-et-2>débat</HAP1-et-2></HAP2> sur <HAP1>le</HAP1>
<HAP2><HAP1-et-2>sujet</HAP1-et-2></HAP2>.
<HAP2><HAP1-et-2>Si</HAP1-et-2></HAP2> <HAP1>plusieurs</HAP1> <HAP1>pays</HAP1> <HAP1>européens</HAP1> <HAP2><HAP1-et-2>cherchent</HAP1-et-2></HAP2> à <HAP2><HAP1-et-2>ménager</HAP1-et-2></HAP2> <HAP1>liberté</HAP1> de la presse
et <HAP1>respect</HAP1> des croyances, <HAP1>le</HAP1> <HAP2><HAP1-et-2>Danemark</HAP1-et-2></HAP2> <HAP1>a</HAP1> <HAP2><HAP1-et-2>campé</HAP1-et-2></HAP2> sur <HAP2><HAP1-et-2>ses</HAP1-et-2></HAP2> <HAP1>positions</HAP1>. Le
gouvernement est <HAP2><HAP1-et-2>resté</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>ferme</HAP1-et-2></HAP2> en <HAP2><HAP1-et-2>répétant</HAP1-et-2></HAP2> <HAP1>vendredi</HAP1> à tous les
ambassadeurs à <HAP1>Copenhague</HAP1> <HAP2><HAP1-et-2>qu</HAP1-et-2></HAP2>'il n'<HAP2><HAP1-et-2>entendait</HAP1-et-2></HAP2> pas <HAP2><HAP1-et-2>transiger</HAP1-et-2></HAP2> sur la
<HAP1>liberté</HAP1> d'expression et ne <HAP2><HAP1-et-2>pouvait</HAP1-et-2></HAP2> s'excuser à la <HAP2><HAP1-et-2>place</HAP1-et-2></HAP2> d'<HAP1>un</HAP1> <HAP2><HAP1-et-2>média</HAP1-et-2></HAP2>.
"<HAP2><HAP1-et-2>Un</HAP1-et-2></HAP2> gouvernement danois ne peut <HAP2><HAP1-et-2>jamais</HAP1-et-2></HAP2> s'excuser au <HAP2><HAP1-et-2>nom</HAP1-et-2></HAP2> d'<HAP1>un</HAP1> <HAP2><HAP1-et-2>journal</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>libre</HAP1-et-2></HAP2> et <HAP2><HAP1-et-2>indépendant</HAP1-et-2></HAP2>", <HAP1>a</HAP1> <HAP2><HAP1-et-2>lancé</HAP1-et-2></HAP2> <HAP1>le</HAP1> <HAP2><HAP1-et-2>premier</HAP1-et-2></HAP2> ministre, <HAP2><HAP1-et-2>Anders</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Fogh</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>Rasmussen</HAP1-et-2></HAP2>, à <HAP1>l</HAP1>'<HAP2><HAP1-et-2>issue</HAP1-et-2></HAP2> de la <HAP2><HAP1-et-2>réunion</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>ayant</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>rassemblé</HAP1-et-2></HAP2> 76 ambassadeurs.