Vendredi 20 Octobre 2006 22:38:50

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200601"><JOUR="20060117"><HEURE="2006011718">
<HAP1><HAP1-et-2>Chaque</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>jour</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>apporte</HAP1-et-2></HAP1> une <HAP1><HAP1-et-2>nouvelle</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>lame</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>fond</HAP1-et-2></HAP1> : <HAP1><HAP1-et-2>aveux</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>perquisitions</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>policières</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>opprobre</HAP1-et-2></HAP1> qui <HAP1><HAP1-et-2>résonne</HAP1-et-2></HAP1> comme un <HAP1><HAP1-et-2>hallali</HAP1-et-2></HAP1>. <HAP1><HAP1-et-2>Demain</HAP1-et-2></HAP1>, <HAP1>des</HAP1>
<HAP1><HAP1-et-2>poursuites</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>judiciaires</HAP1-et-2></HAP1>... <HAP1><HAP1-et-2>La</HAP1-et-2></HAP1> disgrâce du <HAP1><HAP1-et-2>désormais</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>ex</HAP1-et-2></HAP1>-<HAP1><HAP1-et-2>pionnier</HAP1-et-2></HAP1> du
<HAP1><HAP1-et-2>clonage</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>sud</HAP1-et-2></HAP1>-coréen, Hwang <HAP1><HAP1-et-2>Woo</HAP1-et-2></HAP1>-<HAP1><HAP1-et-2>suk</HAP1-et-2></HAP1>, <HAP1>n</HAP1>'est <HAP1>pas</HAP1> <HAP1><HAP1-et-2>uniquement</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>personnelle</HAP1-et-2></HAP1>.
<HAP1><HAP1-et-2>Sa</HAP1-et-2></HAP1> "<HAP1><HAP1-et-2>percée</HAP1-et-2></HAP1>" qui <HAP1>s</HAP1>'est <HAP1><HAP1-et-2>révélée</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>frauduleuse</HAP1-et-2></HAP1> <HAP1>dans</HAP1> la <HAP1><HAP1-et-2>recherche</HAP1-et-2></HAP1> sur <HAP1>les</HAP1>
<HAP1><HAP1-et-2>cellules</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>souches</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>fut</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>élevée</HAP1-et-2></HAP1> au <HAP1><HAP1-et-2>rang</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>triomphe</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>national</HAP1-et-2></HAP1> par <HAP1><HAP1-et-2>Séoul</HAP1-et-2></HAP1>.
<HAP1><HAP1-et-2>Aujourd</HAP1-et-2></HAP1>'<HAP1><HAP1-et-2>hui</HAP1-et-2></HAP1>, sa disgrâce est <HAP1><HAP1-et-2>ressentie</HAP1-et-2></HAP1> comme une <HAP1><HAP1-et-2>trahison</HAP1-et-2></HAP1> de la <HAP1><HAP1-et-2>part</HAP1-et-2></HAP1>
de <HAP1>l</HAP1>'<HAP1><HAP1-et-2>homme</HAP1-et-2></HAP1> qui <HAP1><HAP1-et-2>avait</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>mobilisé</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>tant</HAP1-et-2></HAP1> <HAP1>d</HAP1>'<HAP1><HAP1-et-2>espoirs</HAP1-et-2></HAP1>, mais <HAP1><HAP1-et-2>aussi</HAP1-et-2></HAP1> comme un
<HAP1><HAP1-et-2>déshonneur</HAP1-et-2></HAP1> pour tout le pays. <HAP1><HAP1-et-2>Malmenée</HAP1-et-2></HAP1> par ses <HAP1><HAP1-et-2>grands</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>voisins</HAP1-et-2></HAP1> au <HAP1><HAP1-et-2>cours</HAP1-et-2></HAP1>
de son <HAP1><HAP1-et-2>histoire</HAP1-et-2></HAP1>, la <HAP1><HAP1-et-2>Corée</HAP1-et-2></HAP1> du <HAP1><HAP1-et-2>Sud</HAP1-et-2></HAP1> est <HAP1><HAP1-et-2>habitée</HAP1-et-2></HAP1> par une <HAP1><HAP1-et-2>fierté</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>nationale</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>exacerbée</HAP1-et-2></HAP1>. <HAP1><HAP1-et-2>Avec</HAP1-et-2></HAP1> la <HAP1><HAP1-et-2>chute</HAP1-et-2></HAP1> du <HAP1><HAP1-et-2>professeur</HAP1-et-2></HAP1> Hwang, <HAP1><HAP1-et-2>dépouillé</HAP1-et-2></HAP1> de ses <HAP1><HAP1-et-2>habits</HAP1-et-2></HAP1>
de <HAP1><HAP1-et-2>lumière</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>nobélisable</HAP1-et-2></HAP1> coréen, c'est un <HAP1><HAP1-et-2>rêve</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>reconnaissance</HAP1-et-2></HAP1>
<HAP1><HAP1-et-2>mondiale</HAP1-et-2></HAP1> qui a <HAP1><HAP1-et-2>volé</HAP1-et-2></HAP1> <HAP1>en</HAP1> <HAP1><HAP1-et-2>éclats</HAP1-et-2></HAP1>. "<HAP1><HAP1-et-2>Tout</HAP1-et-2></HAP1> le pays a <HAP1><HAP1-et-2>été</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>trompé</HAP1-et-2></HAP1>", <HAP1><HAP1-et-2>écrit</HAP1-et-2></HAP1> le
<HAP1><HAP1-et-2>quotidien</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>Joong</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>Ang</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>Ilbo</HAP1-et-2></HAP1>.

FICHIER 2

§ <MOIS="200601"><JOUR="20060117"><HEURE="2006011718">
"<HAP2><HAP1-et-2>C</HAP1-et-2></HAP2> 'est à partir de <HAP1>l</HAP1>'âge de 3 ans qu'un enfant <HAP2><HAP1-et-2>commence</HAP1-et-2></HAP2> à <HAP2><HAP1-et-2>influencer</HAP1-et-2></HAP2>
<HAP1>les</HAP1> <HAP2><HAP1-et-2>décisions</HAP1-et-2></HAP2> de sa mère <HAP2><HAP1-et-2>lors</HAP1-et-2></HAP2> de <HAP1>l</HAP1>'achat <HAP1>d</HAP1>'un <HAP2><HAP1-et-2>cadeau</HAP1-et-2></HAP2> qui lui est
<HAP2><HAP1-et-2>destiné</HAP1-et-2></HAP2>" : <HAP2><HAP1-et-2>telle</HAP1-et-2></HAP2> est <HAP1>l</HAP1>'une <HAP1>des</HAP1> <HAP2><HAP1-et-2>conclusions</HAP1-et-2></HAP2> de <HAP1>l</HAP1>'<HAP2><HAP1-et-2>étude</HAP1-et-2></HAP2> "<HAP2><HAP1-et-2>Mère</HAP1-et-2></HAP2>/enfant :
qui a le <HAP2><HAP1-et-2>dernier</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>mot</HAP1-et-2></HAP2> ?", <HAP2><HAP1-et-2>réalisée</HAP1-et-2></HAP2> par <HAP1>l</HAP1>'Institut <HAP1>des</HAP1> mamans et
<HAP2><HAP1-et-2>présentée</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>lundi</HAP1-et-2></HAP2> 16 janvier, au <HAP2><HAP1-et-2>Salon</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>professionnel</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Univers</HAP1-et-2></HAP2> de
<HAP1>l</HAP1>'enfant.
<HAP2><HAP1-et-2>Cependant</HAP1-et-2></HAP2>, la <HAP2><HAP1-et-2>toute</HAP1-et-2></HAP2>-<HAP2><HAP1-et-2>puisssance</HAP1-et-2></HAP2> <HAP1>des</HAP1> petits <HAP2><HAP1-et-2>semble</HAP1-et-2></HAP2> <HAP1>en</HAP1> <HAP2><HAP1-et-2>régression</HAP1-et-2></HAP2>. "<HAP2><HAP1-et-2>Nous</HAP1-et-2></HAP2>
ne <HAP2><HAP1-et-2>sommes</HAP1-et-2></HAP2> plus <HAP1>dans</HAP1> <HAP1>l</HAP1>'<HAP2><HAP1-et-2>ère</HAP1-et-2></HAP2> de <HAP1>l</HAP1>'enfant-<HAP2><HAP1-et-2>roi</HAP1-et-2></HAP2>, analyse <HAP2><HAP1-et-2>Hélène</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>Lepetit</HAP1-et-2></HAP2>,
<HAP2><HAP1-et-2>cofondatrice</HAP1-et-2></HAP2> de <HAP1>l</HAP1>'Institut <HAP1>des</HAP1> mamans. Les mères <HAP1>s</HAP1>'<HAP2><HAP1-et-2>autorisent</HAP1-et-2></HAP2> de plus
<HAP1>en</HAP1> plus à <HAP2><HAP1-et-2>prendre</HAP1-et-2></HAP2> <HAP1>en</HAP1> <HAP2><HAP1-et-2>compte</HAP1-et-2></HAP2> leurs <HAP2><HAP1-et-2>propres</HAP1-et-2></HAP2> critères et <HAP2><HAP1-et-2>seulement</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>ceux</HAP1-et-2></HAP2>-ci, et elles ne <HAP1>s</HAP1>'<HAP1>en</HAP1> <HAP2><HAP1-et-2>cachent</HAP1-et-2></HAP2> plus." <HAP2><HAP1-et-2>Faire</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>plaisir</HAP1-et-2></HAP2> à <HAP1>l</HAP1>'enfant
<HAP2><HAP1-et-2>reste</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>certes</HAP1-et-2></HAP2> la <HAP2><HAP1-et-2>première</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>motivation</HAP1-et-2></HAP2> <HAP1>des</HAP1> parents, mais <HAP1>les</HAP1> <HAP2><HAP1-et-2>rapports</HAP1-et-2></HAP2>
semblent <HAP2><HAP1-et-2>être</HAP1-et-2></HAP2> plus <HAP2><HAP1-et-2>équilibrés</HAP1-et-2></HAP2> au <HAP2><HAP1-et-2>sein</HAP1-et-2></HAP2> de la famille que <HAP1>dans</HAP1> <HAP1>les</HAP1>
<HAP2><HAP1-et-2>décennies</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>précédentes</HAP1-et-2></HAP2>.
<HAP2><HAP1-et-2>Pour</HAP1-et-2></HAP2> <HAP1>les</HAP1> <HAP2><HAP1-et-2>moins</HAP1-et-2></HAP2> de 5 ans, la mère est <HAP2><HAP1-et-2>seule</HAP1-et-2></HAP2> à <HAP2><HAP1-et-2>décider</HAP1-et-2></HAP2> <HAP1>des</HAP1> achats de
jouets et de jeux ; entre 5 et 9 ans, <HAP1>les</HAP1> <HAP2><HAP1-et-2>arguments</HAP1-et-2></HAP2> de celui-ci
<HAP2><HAP1-et-2>comptent</HAP1-et-2></HAP2> pour <HAP2><HAP1-et-2>moitié</HAP1-et-2></HAP2> <HAP1>dans</HAP1> la <HAP2><HAP1-et-2>décision</HAP1-et-2></HAP2> <HAP1>d</HAP1>'achat et, à partir de 9 ans,
c'est le choix de <HAP1>l</HAP1>'enfant qui <HAP1>l</HAP1>'<HAP2><HAP1-et-2>emporte</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Un</HAP1-et-2></HAP2> achat sur 4 est <HAP2><HAP1-et-2>ainsi</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>décidé</HAP1-et-2></HAP2> par le <HAP2><HAP1-et-2>jeune</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>consommateur</HAP1-et-2></HAP2> lorsque celui-ci a entre 5 ans et 8
ans. <HAP2><HAP1-et-2>A</HAP1-et-2></HAP2> <HAP1>l</HAP1>'âge de 10 ans, 54 % <HAP1>des</HAP1> produits de <HAP2><HAP1-et-2>divertissement</HAP1-et-2></HAP2> sont
<HAP2><HAP1-et-2>choisis</HAP1-et-2></HAP2> par <HAP1>l</HAP1>'enfant.
<HAP2><HAP1-et-2>Dans</HAP1-et-2></HAP2> leur influence <HAP2><HAP1-et-2>face</HAP1-et-2></HAP2> à la mère, <HAP1>les</HAP1> <HAP2><HAP1-et-2>petites</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>filles</HAP1-et-2></HAP2> et <HAP1>les</HAP1> petits
<HAP2><HAP1-et-2>garçons</HAP1-et-2></HAP2> semblent à <HAP2><HAP1-et-2>égalité</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Du</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>côté</HAP1-et-2></HAP2> <HAP1>des</HAP1> parents, <HAP1>les</HAP1> comportements
sont <HAP2><HAP1-et-2>semblables</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>quel</HAP1-et-2></HAP2> que <HAP2><HAP1-et-2>soit</HAP1-et-2></HAP2> le <HAP2><HAP1-et-2>niveau</HAP1-et-2></HAP2> <HAP1>d</HAP1>'études de la <HAP2><HAP1-et-2>maman</HAP1-et-2></HAP2> et son
<HAP2><HAP1-et-2>type</HAP1-et-2></HAP2> <HAP1>d</HAP1>'<HAP2><HAP1-et-2>activité</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>socioprofessionnelle</HAP1-et-2></HAP2>, <HAP2><HAP1-et-2>estime</HAP1-et-2></HAP2>-<HAP2><HAP1-et-2>t</HAP1-et-2></HAP2>-<HAP2><HAP1-et-2>on</HAP1-et-2></HAP2> à <HAP1>l</HAP1>'Institut <HAP1>des</HAP1>
mamans, une <HAP2><HAP1-et-2>société</HAP1-et-2></HAP2> <HAP1>d</HAP1>'études <HAP2><HAP1-et-2>privée</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>spécialisée</HAP1-et-2></HAP2> <HAP1>dans</HAP1> <HAP1>l</HAP1>'analyse <HAP1>des</HAP1>
comportements <HAP1>des</HAP1> femmes <HAP2><HAP1-et-2>enceintes</HAP1-et-2></HAP2> et <HAP1>des</HAP1> mères de famille, qui a
<HAP2><HAP1-et-2>interrogé</HAP1-et-2></HAP2> <HAP1>les</HAP1> mères de 919 <HAP2><HAP1-et-2>enfants</HAP1-et-2></HAP2> entre le 20 <HAP2><HAP1-et-2>décembre</HAP1-et-2></HAP2> et le 2
janvier.
Les femmes <HAP2><HAP1-et-2>choisissent</HAP1-et-2></HAP2> <HAP1>en</HAP1> priorité <HAP1>les</HAP1> jouets, jeux ou produits
<HAP2><HAP1-et-2>multimédias</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>dont</HAP1-et-2></HAP2> elles <HAP2><HAP1-et-2>estiment</HAP1-et-2></HAP2> qu'<HAP2><HAP1-et-2>ils</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>aideront</HAP1-et-2></HAP2> au <HAP2><HAP1-et-2>développement</HAP1-et-2></HAP2> de
leur enfant, ce qui <HAP1>n</HAP1>'<HAP2><HAP1-et-2>empêche</HAP1-et-2></HAP2> <HAP1>pas</HAP1> <HAP1>les</HAP1> <HAP2><HAP1-et-2>coups</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>coeur</HAP1-et-2></HAP2>. Le <HAP2><HAP1-et-2>rapport</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>qualité</HAP1-et-2></HAP2>/<HAP2><HAP1-et-2>prix</HAP1-et-2></HAP2> ou <HAP1>l</HAP1>'<HAP2><HAP1-et-2>envie</HAP1-et-2></HAP2> <HAP1>d</HAP1>'une <HAP2><HAP1-et-2>marque</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>particulière</HAP1-et-2></HAP2> <HAP1>n</HAP1>'<HAP2><HAP1-et-2>arrivent</HAP1-et-2></HAP2> <HAP1>pas</HAP1> <HAP1>en</HAP1>
<HAP2><HAP1-et-2>tête</HAP1-et-2></HAP2> <HAP1>des</HAP1> critères de choix. <HAP2><HAP1-et-2>Si</HAP1-et-2></HAP2> elles sont <HAP2><HAP1-et-2>très</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>sûres</HAP1-et-2></HAP2> <HAP1>d</HAP1>'elles <HAP1>en</HAP1> ce qui
<HAP2><HAP1-et-2>concerne</HAP1-et-2></HAP2> <HAP1>les</HAP1> achats <HAP2><HAP1-et-2>destinés</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>aux</HAP1-et-2></HAP2> tout petits, <HAP1>les</HAP1> mères <HAP2><HAP1-et-2>se</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>déterminent</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>davantage</HAP1-et-2></HAP2> <HAP1>en</HAP1> <HAP2><HAP1-et-2>fonction</HAP1-et-2></HAP2> de ce qu'elles <HAP2><HAP1-et-2>ont</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>vu</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>chez</HAP1-et-2></HAP2> leurs <HAP2><HAP1-et-2>amis</HAP1-et-2></HAP2> ou à la
<HAP2><HAP1-et-2>télévision</HAP1-et-2></HAP2> lorsque <HAP1>l</HAP1>'enfant a entre 6 et 10 ans. Le <HAP2><HAP1-et-2>petit</HAP1-et-2></HAP2> de 3 à 5 ans
est, lui, <HAP1>en</HAP1> priorité <HAP2><HAP1-et-2>orienté</HAP1-et-2></HAP2> par la <HAP2><HAP1-et-2>publicité</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>télévisée</HAP1-et-2></HAP2> et <HAP1>les</HAP1>
<HAP2><HAP1-et-2>catalogues</HAP1-et-2></HAP2> <HAP2><HAP1-et-2>promotionnels</HAP1-et-2></HAP2>. <HAP2><HAP1-et-2>Lorsqu</HAP1-et-2></HAP2>'il <HAP2><HAP1-et-2>grandit</HAP1-et-2></HAP2> et entre à <HAP1>l</HAP1>'<HAP2><HAP1-et-2>école</HAP1-et-2></HAP2>
<HAP2><HAP1-et-2>primaire</HAP1-et-2></HAP2>, il est <HAP2><HAP1-et-2>soumis</HAP1-et-2></HAP2> à <HAP1>l</HAP1>'influence de la <HAP2><HAP1-et-2>cour</HAP1-et-2></HAP2> de <HAP2><HAP1-et-2>récréation</HAP1-et-2></HAP2> et <HAP1>des</HAP1>
<HAP2><HAP1-et-2>copains</HAP1-et-2></HAP2>.