Vendredi 20 Octobre 2006 22:38:03

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200603"><JOUR="20060327"><HEURE="2006032709">
Une panne de courant électrique a affecté, dimanche 26 mars, le
fonctionnement d'un important centre hébergeur Internet en banlieue
parisienne, perturbant le fonctionnement d'un grand nombre de sites
français.
La société Redbus Interhouse, dont dépendent un nombre considérable de
sites en France, a subi des coupures d'alimentation d'énergie dans la
journée <HAP1><HAP1-et-2>sur</HAP1-et-2></HAP1> son entrepôt de Courbevoie, indique une responsable de la
société.

FICHIER 2

§ <MOIS="200603"><JOUR="20060327"><HEURE="2006032710">
Une panne de courant électrique a affecté, dimanche 26 mars, le
fonctionnement d'un important centre hébergeur Internet en banlieue
parisienne, perturbant le fonctionnement d'un grand nombre de sites
français.
La société Redbus Interhouse, dont dépendent un nombre considérable de
sites en France, a subi des coupures d'alimentation d'énergie dans la
journée <HAP2><HAP1-et-2>à</HAP1-et-2></HAP2> son entrepôt de Courbevoie, indique une responsable de la
société.