Vendredi 20 Octobre 2006 22:36:32

Projection sur un fichier au format Lexico3 d'un fichier de segments répétés issus de Lexico3, de ses hapax et des 2 fichiers d'hapax associés aux 2 parties de textes constituant l'ensemble du texte.

Mode d'emploi du programme (à lancer dans une fenêtre MSDOS ou "Invites de commandes") :
projette-segments-hapax fichier-SR fichier longueur-plancher-segment frequence-plancher-segment fichier-hapax fichier-hapax1 fichier-hapax2

Ci-dessous, les différentes versions avec le résultat de la projection. En rouge les segments et en bleu les hapax.
Ces 2 types d'unités sont aussi encapsulés dans des balises appelées respectivement SR et HAPAX.

On distingue aussi les hapax du texte n°1 (qui ne sont pas hapax du n°2), ceux du texte n°2 (qui ne sont pas hapax du n°1) et les hapax du texte complet.

FICHIER 1

§ <MOIS="200601"><JOUR="20060120"><HEURE="2006012010">
Mercredi 18 janvier, l'attorney général Alberto Gonzales avait saisi
un tribunal de San Jose pour qu'il enjoigne Google, le géant mondial
de la recherche Internet, à remettre au gouvernement les résultats
d'une semaine de recherches des utilisateurs de Google. Le ministre de
la justice justifiait sa demande en affirmant que ces données lui
étaient nécessaires afin de se défendre dans un procès intenté par
l'ACLU, la grande association américaine de défense des libertés
civiles, pour faire casser une loi sur la pornographie infantile sur
le Web, la "loi sur la protection des enfants, en ligne".
Jeudi, le géant américain a fait savoir qu'il ne comptait pas remettre
ces informations à l'administration : "Google n'est pas concerné par
ces poursuites et cette demande est abusive", a déclaré Nicole Wong,
une conseillère juridique du groupe. "Nous avons eu de longues
discussions avec (des interlocuteurs de l'administration) pour tenter
de résoudre le problème, mais nous n'y sommes pas parvenus et nous
avons l'intention de combattre vigoureusement" leur demande, a-t-elle
ajouté.
A l'origine, le gouvernement avait demandé à Google les adresses de
tous les sites de pornographie pouvant être identifiés ainsi que "les
mots-clés, les termes et symboles de toutes les recherches sur Google
entre le 1^er juin et 31 juillet 2005", selon les documents
judiciaires soumis au tribunal. Il avait toutefois accepté de limiter
nettement ces demandes.
LA PROTECTION DE LA VIE PRIVÉE
Il semble cependant que Google soit isolé. Le gouvernement a fait
savoir qu'un des grands rivaux de Google qui n'a pas été identifié
s'est plié à une injonction identique. Dans un communiqué posté sur
Internet, le groupe Yahoo! a déclaré qu'il avait collaboré avec le
gouvernement de manière limitée et sans fournir de données permettant
d'identifier les utilisateurs. "Nous sommes des défenseurs rigoureux
de la protection de la vie privée", a indiqué un porte-parole de la
société, Mary Osako. Pour sa part, Microsoft a déclaré qu'il "uvre
étroitement avec les services de justice dans le monde entier pour
les aider quand ils le demandent".
Pour sa part, AOL indique avoir fait l'objet d'une requête du même
type en 2005. Sans avoir accepté d'y céder, la compagnie aurait alors
fourni aux autorités une liste des mots-clés utilisés pendant une
journée, mais aucune information sur les utilisateurs du moteur de
recherche. MSN indique avoir fait de même.
Pour de nombreux experts du Réseau, les requêtes gouvernementales dans
ce domaine sont sources d'<HAP1><HAP1-et-2>inquiétudes</HAP1-et-2></HAP1>. "Si Google perd, qu'est-ce qui
va empêcher le gouvernement de réclamer constamment toutes sortes de
choses, que ce soit en invoquant l'antiterrorisme ou des poursuites
contre n'importe quelle société", a déclaré Pam Dixon, du World
Privacy Forum. "Les moteurs de recherche sont un objectif très tentant
pour le gouvernement", a souligné de son côté Beth Givens, directrice
d'une association de protection des libertés civiles de San Diego.
Les marchés aussi semblent inquiets des poursuites dirigées contre
Google : le cours de l'action a enregistré une baisse de 1,9 % au
Nasdaq.

FICHIER 2

§ <MOIS="200601"><JOUR="20060120"><HEURE="2006012011">
Mercredi 18 janvier, l'attorney général Alberto Gonzales avait saisi
un tribunal de San Jose pour qu'il enjoigne Google, le géant mondial
de la recherche Internet, de remettre au gouvernement les résultats
d'une semaine de recherches des utilisateurs de Google. Le ministre de
la justice justifiait sa demande en affirmant que ces données lui
étaient nécessaires afin de se défendre dans un procès intenté par
l'ACLU, la grande association américaine de défense des libertés
civiles, pour faire casser une loi sur la pornographie infantile sur
le Web, la"loi sur la protection des enfants, en ligne".
Jeudi, le géant américain a fait savoir qu'il ne comptait pas remettre
ces informations à l'administration : "Google n'est pas concerné par
ces poursuites et cette demande est abusive", a déclaré Nicole Wong,
une conseillère juridique du groupe. "Nous avons eu de longues
discussions avec (des interlocuteurs de l'administration) pour tenter
de résoudre le problème, mais nous n'y sommes pas parvenus et nous
avons l'intention de combattre vigoureusement" leur demande, a-t-elle
ajouté.
A l'origine, le gouvernement avait demandé à Google les adresses de
tous les sites de pornographie pouvant être identifiés ainsi que "les
mots-clés, les termes et symboles de toutes les recherches sur Google
entre le 1^er juin et 31 juillet 2005", selon les documents
judiciaires soumis au tribunal. Il avait toutefois accepté de limiter
nettement ces demandes.
LA PROTECTION DE LA VIE PRIVÉE
Il semble cependant que Google soit isolé. Le gouvernement a fait
savoir qu'un des grands rivaux de Google qui n'a pas été identifié
s'est plié à une injonction identique. Dans un communiqué posté sur
Internet, le groupe Yahoo! a déclaré qu'il avait collaboré avec le
gouvernement de manière limitée et sans fournir de données permettant
d'identifier les utilisateurs. "Nous sommes des défenseurs rigoureux
de la protection de la vie privée", a indiqué un porte-parole de la
société, Mary Osako. Pour sa part, Microsoft a déclaré qu'il "uvre
étroitement avec les services de justice dans le monde entier pour
les aider quand ils le demandent".
Pour sa part, AOL indique avoir fait l'objet d'une requête du même
type en 2005. Sans avoir accepté d'y céder, la compagnie aurait alors
fourni aux autorités une liste des mots-clés utilisés pendant une
journée, mais aucune information sur les utilisateurs du moteur de
recherche. MSN indique avoir fait de même.
Pour de nombreux experts du Réseau, les requêtes gouvernementales dans
ce domaine sont sources d'<HAP2><HAP1-et-2>inquiétude</HAP1-et-2></HAP2>. "Si Google perd, qu'est-ce qui
va empêcher le gouvernement de réclamer constamment toutes sortes de
choses, que ce soit en invoquant l'antiterrorisme ou des poursuites
contre n'importe quelle société ?" a déclaré Pam Dixon, du World
Privacy Forum. "Les moteurs de recherche sont un objectif très tentant
pour le gouvernement", a souligné de son côté Beth Givens, directrice
d'une association de protection des libertés civiles de San Diego.
Les marchés aussi semblent inquiets des poursuites dirigées contre
Google : le cours de l'action a enregistré une baisse de 1,9 % au
Nasdaq.