On peut traiter les textes, dont un corpus est composé, de deux façons.
D'abord, ils peuvent être pris dans leur ensemble, en bloc, ce qui permet
d'en arriver à une vision plus générale de la langue. Ou encore, on peut les
diviser en sous-blocs, c'est-à-dire en sous-corpus, selon le type de recherche
à laquelle on se livre. Si, par exemple, on veut faire des études comparatives
entre divers genres littéraires ou divers types de textes (vérifier l'aire d'utilisation
d'un mot, comparer les variantes stylistiques entre divers domaines, etc.), il s'avère
utile de sectionner un corpus en sous-corpus. Ces sous-corpus peuvent être composés
selon divers critères, notamment la langue des textes, l'aire géographique d'origine,
leurs genres et leurs registres.
Source : http://www.dico.uottawa.ca/theses/langlois/ll-chap1.htm (consulté le 03/06/2009).