Lexico3 home page
Université de la Sorbonne Nouvelle, Paris 3     Accueil | Contact | Téléchargement | Equipe  
Outils de statistique textuelle       Manuel Lexico 2 | Manuel Lexico 3  
FAQs  |  News  |  Lectures
Lexicometrica | CLA2T | SYLED EA 2290 | Site TAL 

Lexico3
Lexico2
Lexico1
Manuels
Rapports d'analyse
Corpus
Equipe
Liens
 

Contacter-nous par email...  Free counter and web stats

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  

Ouvrage de référence

 

 Lebart, L. & Salem, A. (1994). Statistique Textuelle, Dunod, 344 p. Epuisé, accessible en ligne ici ou .

 

Actes JADT (Journées internationales d’Analyse statistique des Données Textuelles)

 

 

Références bibliographiques

Baayen H. (2001) - “Word Frequency Distributions “, Series: Text, Speech and Language Technology, Volume 18, Kluwer Academic Publishers, Dordrecht Hardbound.

Bécue M. (1988) - Characteristic repeated segments and chains in textual data analysis, COMPSTAT, 8th Symposium on Computational Statistics, Physica Verlag, Vienna.

Becue M., Peiro R. (1993) - Les quasi-segments pour une classification automatique des réponses ouvertes, in Actes des 2ndes Journées Internationales d'analyse des données textuelles, (Montpellier), ENST, Paris, p 310-325.

Benzécri J.-P. & coll. (1973) - La taxinomie, Vol. I ; L'analyse des correspondances, Vol. II, Dunod, Paris.

Benzécri J.-P. (1991a) - Typologies de textes grecs d'après les occurrences des formes des mots-outil, Les Cahiers de l'Analyse des Données, XVI, n°1, p 61-86.

Benzécri J.-P.& coll. (1981a) - Pratique de l'analyse des données, tome 3, Linguistique & Lexicologie, Dunod , Paris.

Bernet C. (1983) - Le vocabulaire des tragédies de Jean Racine, Analyse statistique, Slatkine-Champion, Genève 1983.

Biber D., Conrad S., Reppen R. (1998) - Corpus Linguistics : Investigating language structure and use, Cambridge University Press.

Bolasco S. (1992) - Sur différentes stratégie dans une analyse des formes textuelles : Une expérimentation à partir de données d'enquête, Jornades Internacionals d'Analisi de Dades Textuals, UPC, Barcelona, p 69-88.

Bonnafous S. (1991) - L'immigration prise aux mots. Les immigrés dans la presse au tournant des années quatre-vingt, Kimé, Paris.

Bouillon P. (1998), - Traitement automatique du langage naturel, Editions Duculot.

Brunet E. (1981) - Le vocabulaire français de 1789 à nos jours, d'après les données du Trésor de la langue française, Slatkine-Champion, Genève-Paris.

Crochemore M., Hancart C., Lecroq T. (2001) - Algorithme du texte, Vuibert.

Demonet M., Geffroy A., Gouaze J., Lafon P., Mouillaud M., Tournier M. (1975) - Des tracts en Mai 68. Mesures de vocabulaire et de contenu, Armand Colin et Presses de la Fondation Nat. des Sc. Pol., Paris.

Dendien J. (1986) - La Base de données de l'Institut National de la Langue Française, Actes du colloque international CNRS, Nice, juin 1985, 2 vol., Slatkine-Champion Genève, Paris.

Desgraupes B. (2001 ) Introduction aux expressions régulières , Vuibert.

Geffroy A., Lafon P., Tournier M. (1974) - L'indexation minimale, Plaidoyer pour une non-lemmatisation, Colloque sur l'analyse des corpus linguistiques : "Problèmes et méthodes de l'indexation minimale", Strasbourg 21-23 mai 1973.

Gobin C., Deroubaix J. C. (1987) - Du progrès, de la réforme de l'Etat, de l'austérité. Déclarations gouvernementales en Belgique, Mots, n°15, p 137-170.

Guilbaud G.-Th. (1980) - Zipf et les fréquences, Mots N° 1, p 97-126.

Guilhaumou J. (1986) - L'historien du discours et la lexicométrie. Etude d'une série chronologique : Le père Duchesne de Hébert, juillet 1793- mars 1794, Histoire & Mesure , Vol. I, n° 3-4.

Guiraud P. (1954) - Les caractères statistiques du vocabulaire, P.U.F., Paris.

Guiraud P. (1960) - Problèmes et méthodes de la statistique linguistique, P.U.F., Paris.

Guttman L. (1941) - The quantification of a class of attributes: a theory and method of a scale construction, in The prediction of personal adjustment (P. Horst, ed.), SSCR New York, p 251 -264.

Habert B., Fabre C., Issac F. (1998)- De l'écrit au numérique (constituer, normaliser et exploiter les corpus électroniques), InterEditions.

Habert B., Salem A., Nazarenko A. (1997) - Les linguistiques de corpus, Armand Colin, Paris.

Habert B., Tournier M. (1987) - La tradition chrétienne du syndicalisme français aux prises avec le temps. Evolution comparée des résolutions confédérales (1945 - 1985), Mots, n°14.

Jurafsky D., Martin J. H. (2000) - "Speech and Language Processing : An Introduction to Natural Language Processing”, Computational Linguistics, and Speech Recognition, Prentice-Hall.

Labbé D. (1983) - François Mitterrand - Essai sur le discours, La pensée sauvage, Grenoble.

Labbé D. (1990) - Le vocabulaire de François Mitterrand, Presses de la Fond. Nat. des Sciences Politiques, Paris.

Labbé D. (1990) - Normes de dépouillement et procédures d'analyse des textes politiques, CERAT, Grenoble.

Labbé D., Thoiron P., Serant D. (Ed.) (1988) - Etudes sur la richesse et la structure lexicales, Slatkine-Champion, Paris-Genève.

Lafon P. (1980) - Sur la variabilité de la fréquence des formes dans un corpus, Mots N°1 , p 127-165.

Lafon P. (1981) - Analyse lexicométrique et recherche des cooccurrences, Mots N°3 , p 95-148.

Lafon P. (1981) - Dépouillements et statistiques en lexicométrie, Slatkine-Champion, 1984, Paris.

Lafon P., Salem A. (1983) - L'Inventaire des segments répétés d'un texte, Mots N°6, p 161-177.

Lafon P., Salem A., Tournier M. (1985) - Lexicométrie et associations syntagmatiques (Analyse des segments répétés et des cooccurrences appliquée à un corpus de textes syndicaux). Colloque de l'ALLC, Metz -1983, Slatkine-Champion, Genève, Paris, p 59-72.

Lebart L. (1969) - L'Analyse statistique de la contiguïté, Publications de l'ISUP, XVIII- p 81 - 112.

Lebart L. (1982b) - L'Analyse statistique des réponses libres dans les enquêtes socio-économiques, Consommation, n°1, Dunod, p 39-62.

Lebart L., Salem A. (1988) - Analyse statistique des données textuelles, Dunod, Paris.

Lebart, L. & Salem, A. (1994). Statistique Textuelle, Dunod, 344 p. Epuisé, accessible en ligne ici ou .

Lebart L., Salem A., Berry E. (1991) - Recent development in the statistical processing of textual data, Applied Stoch. Model and Data Analysis, 7, p 47-62.

Manning C., Schütze H. (1999) - Foundations of Statistical Natural Language Processing, MIT Press. Cambridge.

Menard N. (1983) - Mesure de la richesse lexicale, théorie et vérifications expérimentales, Slatkine-Champion, Paris.

Muller C. (1964) - Essai de statistique lexicale : L'illusion comique de P. Corneille, Klincksieck, Paris.

Muller C. (1968) - Initiation à la statistique linguistique, Larousse, Paris.

Muller C. (1977) - Principes et méthodes de statistique lexicale, Hachette, Paris.

Muller C.(1967) - Etude de statistique lexicale. Le vocabulaire du théâtre de Pierre Corneille, Paris, Larousse.

Pêcheux M. (1969) - Analyse automatique du discours, Dunod, Paris.

Peschanski D. (1988) - Et pourtant, ils tournent. Vocabulaire et stratégie du PCF (1934 - 1936), Klincksieck, Paris.

Petruszewycz M. (1973) - L'histoire de la loi d'Estoup-Zipf, Math. Sciences Hum., n°44.

Pierrel J.-M.(2000) - Ingénierie des langues, Traité IC2 -Série informatique et SI, Hermes

Reinert M. (1990) - Alceste, Une méthodologie d'analyse des données textuelles et une Application : Aurélia de Gérard de Nerval, Bull. de Méthod. Sociol. n°26, p 24-54.

Romeu L. (1992) - Approche du discours éditorial de Ya et Arriba (1939 - 1945), Thèse Paris 3.

Salem A. (1984) - La typologie des segments répétés dans un corpus, fondée sur l'analyse d'un tableau croisant mots et textes, Les Cahiers de l'Analyse des Données, Vol IX, n° 4, p 489-500.

Salem A. (1986) - Segments répétés et analyse statistique des données textuelles, Etude quantitative à propos du père Duchesne de Hébert, Histoire & Mesure, Vol. I- n° 2, Paris, Ed. du CNRS.

Salem A. (1987) - Pratique des segments répétés, Essai de satistique textuelle, Klincksieck, Paris.

Salem A. (1993) - Méthodes de la statistique textuelle, Thèse d'Etat, Université Sorbonne Nouvelle (Paris 3).

Sekhraoui M. (1981) - La saisie des textes et le traitement des mots: Problèmes posés, essai de solution, Mémoire, Ecole des hautes études en sciences sociales, Paris.

Tournier M. (1980) - D'ou viennent les fréquences de vocabulaire?, Mots N°1, p 189-212.

Tournier M. (1985a) - Sur quoi pouvons-nous compter ? Hommage à Hélène Nais, Verbum.

Tournier M. (1985b) - Texte propagandiste et cooccurrences. Hypothèses et méthodes pour l'étude de la sloganisation, Mots N°11, p 155-187.

Van Rijckevorsel J. (1987) - The application of fuzzy coding and horseshoes in multiple correspondances analysis, DSWO Press, Leyde. 

Véronis J.(2000) - « Annotation automatique de corpus : panorama et état de la technique », Ingénierie des langues. J. M. Pierrel. Paris, Hermès.

Yule G.U. (1944) - The Statistical Study of Literary Vocabulary, Cambridge University Press, Reprinted in 1968 by Archon Books, Hamden, Connecticut.

Zipf G. K. (1935) - The Psychobiology of Language, an Introduction to Dynamic Philology, Boston, Houghton-Mifflin.

 


Cyber-bibliographie

Liens

·       FRANTEXT : http://zeus.inalf.cnrs.fr

·       LEXICOMETRICA : http://lexicometrica.univ-paris3.fr/

·       MARGES-LINGUISTIQUES : http://www.marges-linguistiques.com/

·       ATALA : http://www.atala.org/