Vendredi 20 Octobre 2006 22:38:47

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200604"><JOUR="20060406"><HEURE="2006040614">
Les fichiers de police judiciaire, utilisés pour l'embauche de
certains personnels, de sécurité notamment, sont devenus "un casier
judiciaire parallèle", s'inquiète la <HAP1>Commission</HAP1> nationale de
l'informatique et des libertés (CNIL) dans son rapport 2005 publié
jeudi 6 avril. "En 2006 comme en 2005, les conséquences sociales de la
consultation des fichiers de police judiciaire à des fins
administratives resteront une préoccupation majeure de la CNIL",
avertit la <HAP1><HAP1-et-2>commission</HAP1-et-2></HAP1>.

FICHIER 2

§ <MOIS="200604"><JOUR="20060406"><HEURE="2006040615">
Les fichiers de police judiciaire, utilisés pour l'embauche de
certains personnels, de sécurité notamment, sont devenus "un casier
judiciaire parallèle", s'inquiète la <HAP1>Commission</HAP1> nationale de
l'informatique et des libertés (CNIL) dans son rapport 2005 publié
jeudi 6 avril. "En 2006 comme en 2005, les conséquences sociales de la
consultation des fichiers de police judiciaire à des fins
administratives resteront une préoccupation majeure de la CNIL",
avertit la <HAP1>Commission</HAP1>.