Partie 1


1.1 Exercice sur le père Duchesne


 Le texte de travail à partir duquel toutes les données sont extraites se trouve à cette adresse : http://www.cavi.univ-paris3.fr/ilpga/tal/corpus/duchn.fr
( Nota bene : Dans la page ci-dessous, toutes les images ayant des liens hyper-texte sont encadrées en bleu.)

Voici la liste des recherches. Cliquez directement sur un intitulé pour y accéder :

Les mots commençant par citoy.
Les mots commençant par aristo
Les mots commençant par bougre
Les mots qui parlent de sans-culotte
Les mots contenant une majuscule
Les mots se finissant en -er
Les mots qui parlent de danger
Les mots qui parlent de patrie
Les mots qui parlent de liberté
Les mots qui parlent de temps
Les mots qui parlent de republique
Les mots qui parlent de trahison
Les formes de négation

rep1-q1

En cliquant sur l'image ci-dessous, vous obtiendrez l'aperçu du nombre de lignes dans lesquelles apparaissent le mot citoyen. L'expression régulière permettant de trouver le nombre est ligne est : -c

rep1bis

  • Contenant des mots commençant par "aristo"
E,n cliquant sur cette image, toutes les lignes contenant les mots commençant par aristo vont apparaitre :
rep2-q1

  • Contenant les mots commençant par "bougre"
rep3-q1
Le point d'interrogation permet d'exclure ou non le s final .Grâce à cette commande nous pourrons trouver les occurrences de "bougre" et "bougres"

rep3bis-q1

  • Les mots qui parlent de "sans-culottes"
rep4-q1

rep4bis-q1
Nous avons remarqué que dans le texte, le mot sans culotte était  précédé d'une étoile. L'étoile étant une expression régulière, il faut la déspécialiser à l'aide de l'anti-slash.

  • Les mots contenant une majuscule
rep5-q1
Il ya  2010 lignes qui contiennent des majuscules.

  • Les mots se finissant par -er
rep6-q1

  • Contenant les mots qui parlent de danger
rep7-q1

  • Contenant les mots qui parlent de partie
rep8-q1
Le [eo] permet d'obtenir tous les mots qui commencent par "patrie" ou "patrio".

  • Contenant les mots qui parlent de liberté
rep9-q1

rep9bis-q1
Le point permet de remplacer n'importe quelle lettre. Ici avec l'expression régulière -c qui permet de compter le nombre de lignes dans lesquelles se trouvent les occurrences recherchées nous voyons que le mot liberté n'est employé qu'au singulier dans ce texte.

  • Concernant les mots qui parlent de temps.
rep10-q1

  • Concernant les mots qui parlent de république
rep11-q1

  • Concernant les mots qui parlent de trahison
rep12-q1

  • Contenant une séquence de mot de forme négative
rep13-q1

rep13bis-q1

Ici nous avons regardé dans combien de ligne apparait chaque occurrence. Nous pouvons constater que dans ce texte, c'est la négation " ne pas " qui apparait le plus souvent.

flècheSommaire / page suivante  flèche