Vendredi 20 Octobre 2006 22:41:14

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200609"><JOUR="20060914"><HEURE="2006091414">
<HAP1><HAP1-et-2>L</HAP1-et-2></HAP1>'<HAP1><HAP1-et-2>embellie</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>se</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>confirme</HAP1-et-2></HAP1>. <HAP1><HAP1-et-2>Les</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>créations</HAP1-et-2></HAP1> d'<HAP1><HAP1-et-2>emplois</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>dans</HAP1-et-2></HAP1> le secteur
marchand <HAP1><HAP1-et-2>ont</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>encore</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>augmenté</HAP1-et-2></HAP1> au <HAP1><HAP1-et-2>deuxième</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>trimestre</HAP1-et-2></HAP1> 2006 : 70 900
<HAP1><HAP1-et-2>nouveaux</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>postes</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>soit</HAP1-et-2></HAP1> + 0,4 %, après des <HAP1><HAP1-et-2>hausses</HAP1-et-2></HAP1> de 0,3 % au <HAP1><HAP1-et-2>cours</HAP1-et-2></HAP1> des
<HAP1><HAP1-et-2>deux</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>trimestres</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>précédents</HAP1-et-2></HAP1>. <HAP1><HAP1-et-2>D</HAP1-et-2></HAP1>'après les <HAP1><HAP1-et-2>chiffres</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>communiqués</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>jeudi</HAP1-et-2></HAP1> 14
<HAP1><HAP1-et-2>septembre</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>par</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>l</HAP1-et-2></HAP1>'<HAP1><HAP1-et-2>Unedic</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>qui</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>perçoit</HAP1-et-2></HAP1> les <HAP1><HAP1-et-2>cotisations</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>chômage</HAP1-et-2></HAP1> de <HAP1><HAP1-et-2>tous</HAP1-et-2></HAP1>
les <HAP1><HAP1-et-2>salariés</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>du</HAP1-et-2></HAP1> secteur marchand (<HAP1><HAP1-et-2>hors</HAP1-et-2></HAP1> secteur <HAP1><HAP1-et-2>public</HAP1-et-2></HAP1>, <HAP1><HAP1-et-2>fonctionnaires</HAP1-et-2></HAP1>,
<HAP1><HAP1-et-2>agriculture</HAP1-et-2></HAP1>...), le <HAP1><HAP1-et-2>gain</HAP1-et-2></HAP1> d'<HAP1><HAP1-et-2>emploi</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>sur</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>un</HAP1-et-2></HAP1> <HAP1><HAP1-et-2>an</HAP1-et-2></HAP1>, de juin <HAP1><HAP1-et-2>à</HAP1-et-2></HAP1> juin, <HAP1><HAP1-et-2>est</HAP1-et-2></HAP1> de
201 400.
§