Vendredi 20 Octobre 2006 22:36:08

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200606"><JOUR="20060613"><HEURE="2006061321">
Depuis quelques mois, Raymond Domenech le répète, il n'a que deux
dates en tête. <HAP1><HAP1-et-2>Le</HAP1-et-2></HAP1> 13 juin, pour l'entrée de la France dans la Coupe du
monde contre la Suisse, et le 9 juillet, pour la sortie rêvée des
Bleus par la grande porte d'une finale mondiale. Et tous joueurs,
observateurs, supporters s'accordaient à penser que la route vers le 9
juillet passait forcément par un bon début dans la compétition, et
donc par une victoire, ce mardi 13 juin.

FICHIER 2

§ <MOIS="200606"><JOUR="20060614"><HEURE="2006061410">
Depuis quelques mois, Raymond Domenech le répète, il n'a que deux
dates en tête : le 13 juin, pour l'entrée de la France dans la Coupe
du monde contre la Suisse, et le 9 juillet, pour la sortie rêvée des
Bleus par la grande porte d'une finale mondiale. Et tous joueurs,
observateurs, supporters s'accordaient à penser que la route vers le 9
juillet passait forcément par un bon début dans la compétition, et
donc par une victoire, ce mardi 13 juin.