Ouvrage de référence
Lebart, L. & Salem, A. (1994). Statistique Textuelle, Dunod, 344 p. Epuisé, accessible en ligne ici ou là.
Actes JADT (Journées internationales d’Analyse statistique des Données Textuelles)
Références bibliographiques
Baayen H. (2001) - “Word Frequency Distributions “, Series: Text, Speech and Language Technology,
Volume 18, Kluwer Academic Publishers, Dordrecht Hardbound.
Bécue M. (1988) - Characteristic repeated
segments and chains in textual data analysis, COMPSTAT, 8th Symposium on
Computational Statistics, Physica Verlag, Vienna.
Becue M., Peiro
R. (1993) - Les quasi-segments pour une classification automatique des réponses
ouvertes, in Actes des 2ndes Journées Internationales d'analyse des données
textuelles, (Montpellier), ENST, Paris, p 310-325.
Benzécri J.-P.
& coll. (1973) - La taxinomie, Vol. I ; L'analyse des correspondances, Vol.
II, Dunod, Paris.
Benzécri J.-P.
(1991a) - Typologies de textes grecs d'après les occurrences des formes des
mots-outil, Les Cahiers de l'Analyse des Données, XVI, n°1, p 61-86.
Benzécri
J.-P.& coll. (1981a) - Pratique de l'analyse des données, tome 3,
Linguistique & Lexicologie, Dunod , Paris.
Bernet C. (1983)
- Le vocabulaire des tragédies de Jean Racine, Analyse statistique,
Slatkine-Champion, Genève 1983.
Biber
D., Conrad S., Reppen R. (1998) - Corpus Linguistics : Investigating language structure and use, Cambridge University Press.
Bolasco S. (1992)
- Sur différentes stratégie dans une analyse des formes textuelles : Une
expérimentation à partir de données d'enquête, Jornades Internacionals
d'Analisi de Dades Textuals, UPC, Barcelona, p 69-88.
Bonnafous S.
(1991) - L'immigration prise aux mots. Les immigrés dans la presse au tournant
des années quatre-vingt, Kimé, Paris.
Bouillon P. (1998), - Traitement
automatique du langage naturel, Editions Duculot.
Brunet E. (1981)
- Le vocabulaire français de 1789 à nos jours, d'après les données du Trésor de
la langue française, Slatkine-Champion, Genève-Paris.
Crochemore M., Hancart C., Lecroq T. (2001) - Algorithme du texte, Vuibert.
Demonet M.,
Geffroy A., Gouaze J., Lafon P., Mouillaud M., Tournier M. (1975) - Des tracts
en Mai 68. Mesures de vocabulaire et de contenu, Armand Colin et Presses de la
Fondation Nat. des Sc. Pol., Paris.
Dendien J. (1986)
- La Base de données de l'Institut National de la Langue Française, Actes du
colloque international CNRS, Nice, juin 1985, 2 vol., Slatkine-Champion Genève,
Paris.
Desgraupes B. (2001 ) Introduction
aux expressions régulières , Vuibert.
Geffroy A., Lafon
P., Tournier M. (1974) - L'indexation minimale, Plaidoyer pour une
non-lemmatisation, Colloque sur l'analyse des corpus linguistiques :
"Problèmes et méthodes de l'indexation minimale", Strasbourg 21-23
mai 1973.
Gobin C.,
Deroubaix J. C. (1987) - Du progrès, de la réforme de l'Etat, de l'austérité.
Déclarations gouvernementales en Belgique, Mots, n°15, p 137-170.
Guilbaud G.-Th. (1980) - Zipf et les
fréquences, Mots N° 1, p 97-126.
Guilhaumou J.
(1986) - L'historien du discours et la lexicométrie. Etude d'une série
chronologique : Le père Duchesne de Hébert, juillet 1793- mars 1794, Histoire
& Mesure , Vol. I, n° 3-4.
Guiraud P. (1954)
- Les caractères statistiques du vocabulaire, P.U.F., Paris.
Guiraud P. (1960)
- Problèmes et méthodes de la statistique linguistique, P.U.F., Paris.
Guttman L. (1941) - The quantification of a
class of attributes: a theory and method of a scale construction, in The
prediction of personal adjustment (P. Horst, ed.), SSCR New York, p 251 -264.
Habert B., Fabre C., Issac F. (1998)- De l'écrit au numérique
(constituer, normaliser et exploiter les corpus électroniques),
InterEditions.
Habert B., Salem A., Nazarenko A. (1997) - Les linguistiques de corpus, Armand Colin, Paris.
Habert B.,
Tournier M. (1987) - La tradition chrétienne du syndicalisme français aux
prises avec le temps. Evolution comparée des résolutions confédérales (1945 -
1985), Mots, n°14.
Jurafsky
D., Martin J. H. (2000) - "Speech and Language Processing : An
Introduction to Natural Language Processing”, Computational Linguistics, and Speech Recognition, Prentice-Hall.
Labbé D. (1983) -
François Mitterrand - Essai sur le discours, La pensée sauvage, Grenoble.
Labbé D. (1990) -
Le vocabulaire de François Mitterrand, Presses de la Fond. Nat. des Sciences
Politiques, Paris.
Labbé D. (1990) -
Normes de dépouillement et procédures d'analyse des textes politiques, CERAT,
Grenoble.
Labbé D., Thoiron
P., Serant D. (Ed.) (1988) - Etudes sur la richesse et la structure lexicales,
Slatkine-Champion, Paris-Genève.
Lafon P. (1980) -
Sur la variabilité de la fréquence des formes dans un corpus, Mots N°1 , p
127-165.
Lafon P. (1981) -
Analyse lexicométrique et recherche des cooccurrences, Mots N°3 , p 95-148.
Lafon P. (1981) -
Dépouillements et statistiques en lexicométrie, Slatkine-Champion, 1984, Paris.
Lafon P., Salem
A. (1983) - L'Inventaire des segments répétés d'un texte, Mots N°6, p 161-177.
Lafon P., Salem
A., Tournier M. (1985) - Lexicométrie et associations syntagmatiques (Analyse
des segments répétés et des cooccurrences appliquée à un corpus de textes
syndicaux). Colloque de l'ALLC, Metz -1983, Slatkine-Champion, Genève, Paris, p
59-72.
Lebart L. (1969)
- L'Analyse statistique de la contiguïté, Publications de l'ISUP, XVIII- p 81 -
112.
Lebart L. (1982b)
- L'Analyse statistique des réponses libres dans les enquêtes
socio-économiques, Consommation, n°1, Dunod, p 39-62.
Lebart L., Salem
A. (1988) - Analyse statistique des données textuelles, Dunod, Paris.
Lebart, L. & Salem, A. (1994). Statistique Textuelle, Dunod, 344 p. Epuisé, accessible en ligne ici ou là.
Lebart L., Salem A., Berry E. (1991) - Recent
development in the statistical processing of textual data, Applied Stoch. Model
and Data Analysis, 7, p 47-62.
Manning
C., Schütze H. (1999) - Foundations of
Statistical Natural Language Processing, MIT Press. Cambridge.
Menard N. (1983)
- Mesure de la richesse lexicale, théorie et vérifications expérimentales,
Slatkine-Champion, Paris.
Muller C. (1964)
- Essai de statistique lexicale : L'illusion comique de P. Corneille,
Klincksieck, Paris.
Muller C. (1968)
- Initiation à la statistique linguistique, Larousse, Paris.
Muller C. (1977)
- Principes et méthodes de statistique lexicale, Hachette, Paris.
Muller C.(1967) -
Etude de statistique lexicale. Le vocabulaire du théâtre de Pierre Corneille,
Paris, Larousse.
Pêcheux M. (1969)
- Analyse automatique du discours, Dunod, Paris.
Peschanski D.
(1988) - Et pourtant, ils tournent. Vocabulaire et stratégie du PCF (1934 -
1936), Klincksieck, Paris.
Petruszewycz M.
(1973) - L'histoire de la loi d'Estoup-Zipf, Math. Sciences Hum., n°44.
Pierrel J.-M.(2000) - Ingénierie des langues, Traité IC2 -Série informatique et SI,
Hermes
Reinert M. (1990)
- Alceste, Une méthodologie d'analyse des données textuelles et une Application
: Aurélia de Gérard de Nerval, Bull. de Méthod. Sociol. n°26, p 24-54.
Romeu L. (1992) -
Approche du discours éditorial de Ya et Arriba (1939 - 1945), Thèse Paris 3.
Salem A. (1984) -
La typologie des segments répétés dans un corpus, fondée sur l'analyse d'un
tableau croisant mots et textes, Les Cahiers de l'Analyse des Données, Vol IX,
n° 4, p 489-500.
Salem A. (1986) -
Segments répétés et analyse statistique des données textuelles, Etude
quantitative à propos du père Duchesne de Hébert, Histoire & Mesure, Vol.
I- n° 2, Paris, Ed. du CNRS.
Salem A. (1987) -
Pratique des segments répétés, Essai de satistique textuelle, Klincksieck,
Paris.
Salem A. (1993) -
Méthodes de la statistique textuelle, Thèse d'Etat, Université Sorbonne
Nouvelle (Paris 3).
Sekhraoui M.
(1981) - La saisie des textes et le traitement des mots: Problèmes posés, essai
de solution, Mémoire, Ecole des hautes études en sciences sociales, Paris.
Tournier M.
(1980) - D'ou viennent les fréquences de vocabulaire?, Mots N°1, p 189-212.
Tournier M.
(1985a) - Sur quoi pouvons-nous compter ? Hommage à Hélène Nais, Verbum.
Tournier M.
(1985b) - Texte propagandiste et cooccurrences. Hypothèses et méthodes pour
l'étude de la sloganisation, Mots N°11, p 155-187.
Van Rijckevorsel J. (1987) - The application of
fuzzy coding and horseshoes in multiple correspondances analysis, DSWO Press,
Leyde.
Véronis J.(2000) -
« Annotation automatique de corpus : panorama et état de la
technique », Ingénierie des langues.
J. M. Pierrel. Paris, Hermès.
Yule G.U. (1944) - The Statistical Study of
Literary Vocabulary, Cambridge University Press, Reprinted in 1968 by Archon
Books, Hamden, Connecticut.
Zipf G. K. (1935) - The
Psychobiology of Language, an Introduction to Dynamic Philology, Boston,
Houghton-Mifflin.
Cyber-bibliographie
Liens
·
FRANTEXT : http://zeus.inalf.cnrs.fr
· LEXICOMETRICA : http://lexicometrica.univ-paris3.fr/
·
MARGES-LINGUISTIQUES : http://www.marges-linguistiques.com/
·
ATALA : http://www.atala.org/