Retour Partie 2

Requêtes Texte Brut

ANTCONC est un concordancier permettant en général des requêtes par des expressions régulières et utilisant une fenêtre de commandes. UNIX qui est un outil de filtrage: egrep+expr régulière et un outil util pour traîter ainsi des données textuelles. Unix est un système d'exploitation disponible sur les linux et macros et utilisant le programme CYGWIN qui sert à taper des commandes.

Dans cette partie on dispose d'un texte où les applications dans cygwin nous permettront de filtrer des lignes dans un fichier.

Plusieurs commandes y sont utilisés: pwd (affiche le répertoire courant), cd(permet de changer de répertoire), ls (affiche le contenu du répertoire courant), egrep (celui-ci est la plus utilisée car elle permet d'indiquer les options à travers les expressions régulières).


Fichier à travailler

Exercice 1

  • Soit des mots commençant par "citoy"

 -> La variable \b nous permet de trouver les mots commençant par la variable: soit \bcitoy.

        Découvrez le résultat!



Vérifier sur antconc

Exercice 2

  • Soit les lignes contenant des mots commençant par « aristo ».

"
    De même, on utilise \b à fin de voir tous les mots de la même famille de "aristocrate".
   
    Voyez ce que ceci nous a donné!


Version antconc


Exercice 3

  • On cherche les lignes contenant des mots commençant par « bougre ».


    Voici ce que vous trouverez!!


Voyez sur antconc

Exercice 4

  • On va filtrer mes lignes qui parlent des « Sans-culottes » .

    Ici on ajoute une option i- qui sert à ne pas tenir compte de la casse des caractères car dans le texte on remarque des termes en commençant à la fois par une majuscule et une minuscule.
  
     Le voici!!!


Résultat sur antconc

Exercice 5

  • Il nous faut ici extraire les lignes contenant une majuscule

Les caractères "*" s'interprètent donc finalement comme "0 à n occurrences d'un caractère quelconque" contenant toutes les caractères de l'alphabet comment par une majuscule "\*"[A



Versions antconc

Exercice 6

  • On veut les lignes contenant des mots qui se terminent par « er »

    $ est le caractère qui permet de conditionner la fin de chaîne qui est -er.



Sur antconc, cliquez!

Exercice 7

  • Les lignes contenant des mots qui parlent de «danger » .

    En consultant le lexique, nous remarquons que tous ces mots sont les mots de la même famille de "danger". Voyons comme la commande est un moyen pour pouvoir étudier un contexte dans un fichier. Tous ces mots commencent par "danger" d'où : \bdanger. Les voici:



Antconc, cliquez ->

Exercice 8

  • Extraction des lignes contenant des mots qui parlent de «patrie ».

    On a ici à dériver  les mots "patrie, patriote"; c'est pourquoi on insère [eo] pour qu'on ait les deux formes.



Voyez ceci sur antconc

Exercice 9

  • Les lignes contenant des mots qui parlent de « liberté » .

    On devrait avoir tous les mots de la même famille de liberté dont "libre, libérer". Ainsi on cherche ainsi les mots commençant par lib: \blib


Versions antconc

Exercice 10

  • Voici la commande qui nous permet d'obtenir les lignes contenant des mots qui parlent de "temps"

    Après execution de la commande, on remarque que nous avons les termes qui parlent du temps, le temps physique de la nature. On a alors le temps, le temporel d'où les caractères [so]. Découvrez ceci dans cete fenêtre:



Résultat sur antconc

Exercice 11

  • Trouvons les lignes contenant des mots qui parlent de « république ».

    Sachant tout d'abord que les accents ne sont pas pris en compte dans les commandes. On utilise ainsi . pour y mettre tout caractère. On utilise \br.pub pour pouvoir extraire les mots commençant pars ces caractères et qui fournit les mots de la même famille: république, républicain.


Antconc

Exercice 12

  • les lignes contenant des mots qui parlent de « trahison ».

On a "trahir, trahison", c'est pourquoi on utilise les caractères commençant par "trahi" (ces mots ne sont que trahir et trahison).


Voyez antconc!!

Exercice 13

  • On peut même avoir les lignes contenant des séquences de mots comportant une forme négative : ne...pas, n’...pas,




Vérifiez aussi que ceci fonctionne sur antconc ->