Quelques définitions

FIL RSS

Les flux RSS sont des flux de contenu gratuit en provenance de sites Internet. Ils incluent les titres des articles, des résumés et des liens vers les articles intégraux à consulter en ligne. Les dernières informations publiés sur Le Monde.fr peuvent ainsi venir enrichir automatiquement votre site Internet ou compléter vous sources d'informations déjà abrégées via un logiciel de lecture des flux RSS.

occurrence

Unité linguistique qui apparaît dans un corpus

forme

Ensemble des sons (forme phonique) ou des lettres (forme graphique) qui constituent un terme.
ou
L’une des trois principales informations qui est fournie par un étiqueteur morphosyntaxique.

Pour en savoir plus sur les étiqueteurs morphosyntaxiques, vous pouvez consulter l'article suivant : cliquez ici

corpus

Ensemble des sources orales et écrites relatives à un domaine étudié.

partie de corpus

On peut traiter les textes, dont un corpus est composé, de deux façons. D'abord, ils peuvent être pris dans leur ensemble, en bloc, ce qui permet d'en arriver à une vision plus générale de la langue. Ou encore, on peut les diviser en sous-blocs, c'est-à-dire en sous-corpus, selon le type de recherche à laquelle on se livre. Si, par exemple, on veut faire des études comparatives entre divers genres littéraires ou divers types de textes (vérifier l'aire d'utilisation d'un mot, comparer les variantes stylistiques entre divers domaines, etc.), il s'avère utile de sectionner un corpus en sous-corpus. Ces sous-corpus peuvent être composés selon divers critères, notamment la langue des textes, l'aire géographique d'origine, leurs genres et leurs registres.
Source : http://www.dico.uottawa.ca/theses/langlois/ll-chap1.htm (consulté le 03/06/2009).

Retour en haut de la page