Partie 1

Exercice sur le « Père Duchesne »  (version texte brute)

http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/corpus/duchn.txt

 

    • Ecrire une commande qui permet de filtrer les lignes :

     

     

      • contenant des mots commençant par « citoy » :
    • Commande egrep

     

    • Résultat         

    Cliquez ici

     

     

      • contenant des mots commençant par « aristo » :
    • Commande egrep


    • Résultat

     Cliquez ici

     

     

      • contenant des mots commençant par « bougre »:
    • Commande egrep


    • Résultat

    Cliquez ici

     

     

      • qui parlent des « Sans-culottes »:
    • Commande egrep

    • Résultat

    Cliquez ici

     

     

      • contenant une majuscule :
    • Commande egrep

     

    • Résultat

    Cliquez ici

     

     

      • contenant des mots qui se terminent par « er »:
    • Commande egrep

     

    • Résultat

    Cliquez ici

     

     

      • contenant des mots qui parlent de « danger »:
    • Commande egrep

     

    • Résultat

    Cliquez ici

     

     

      • contenant des mots qui parlent de « patrie »:
    • Commande egrep

     

    • Résultat

    Cliquez ici

     

     

      • contenant des mots qui parlent de « liberté »:
    • Commande egrep
       
    • Résultat

    Cliquez ici

     

     

      • contenant des mots qui parlent de « temps »:
    • Commande egrep

    • Résultat

    Cliquez ici

     

     

      • contenant des mots qui parlent de « république »:
    • Commande egrep

     

    • Résultat

    Cliquez ici

     

     

      • contenant des mots qui parlent de « trahison »:
    • Commande egrep

     

    • Résultat

    Cliquez ici

     

     

      • contenant des séquences de mots comportant une forme négative : "ne...pas, n’...pas, ....":
    • Commande egrep

     

    • Résultat

    Cliquez ici

    Partie 2

    Exercice sur un dictionnaire
    http://tal.univ-paris3.fr/corpus/dico.zip 

     

    • Combien de mots dans le fichier ?

    Commande


    Il y a donc, dans ce fichier, 138257 mots ou lignes (un mot par ligne)

     

     

    • Avec la commande egrep extrayez les mots se terminant par -able.

    Commande

    Résultat


    Cliquez ici

     

     

    • Combien y a-t-il de mots terminé par -able ? A quelle(s) partie(s) du discours sont-il rattachés ?

    Commande



    Il y a donc 497 mots se terminant par –able dans ce fichier. Ils appartiennent surtout à la catégorie des adjectifs « abominable » ou des adverbes « payable »

     

     

    • Même question pour -eux.

    Commande

    Résultat


    Cliquez ici

     

     


    Commande



    Il y a donc 369 mots se terminant par –eux dont des adjectifs "affreux", des pluriels "feux" ou des adverbes

     

     

    • Quelle commande permet d'extraire à la fois les mots se terminant par -able et ceux se terminant par -ible:

    abominable
    abordable
    accable
    acceptable
    accessible
    achetable
    adaptable
    admirable
    admissible

    ...

    Voici le dictionnaire que l'on peut obtenir en format XML

     

    Cliquez sur le lien