Exercice 1: Texte du Père Duchesne

Nous avons utilisé l'outil egrep pour filtrer les lignes recherchées. Puis les compter.
Les résultats ont été obtenus sous cygwin.

Ecrire une commande qui permet de filtrer les lignes :

  1. contenant des mots commençant par « citoy »: egrep -i "\bcitoy" duchn.txt
    lien vers resultat
    • Nombre d'occurences: egrep -ic "\bcitoy" duchn.txt
      le résultat obtenu est 102.

  2. contenant des mots commençant par « aristo »: egrep -i "\baristo" duchn.txt
    lien vers resultat
    • Nombre d'occurences: egrep -ic "\baristo" duchn.txt
      le résultat obtenu est 162.

  3. contenant des mots commençant par « bougre »: egrep -i "\bbougre" duchn.txt
    lien vers resultat
    • Nombre d'occurences: egrep -ic "\bbougre" duchn.txt
      le résultat obtenu est 304.

  4. qui parlent des « Sans-culottes »: egrep -i "\bSans-culottes" duchn.txt
    lien vers resultat
    • Nombre d'occurences: egrep -ic "\bSans-culottes" duchn.txt
      le résultat obtenu est 400.

  5. contenant une majuscule: egrep "\*" duchn.txt
    lien vers resultat
    • Nombre d'occurences: egrep -c "\*" duchn.txt
      le résultat obtenu est 3077.

  6. contenant des mots qui se terminent par « er »: egrep "er\b" duchn.txt
    lien vers resultat
    • Nombre d'occurences: egrep -c "er\b" duchn.txt
      le résultat obtenu est 3345.

  7. contenant des mots qui parlent de «danger »: egrep "\bdanger|dangeur" duchn.txt
    lien vers resultat
    • Nombre d'occurences: egrep -c "\bdanger|dangeur" duchn.txt
      le résultat obtenu est 25.

  8. contenant des mots qui parlent de «patrie »: egrep "\bpatri(o|e)" duchn.txt
    lien vers resultat
    • Nombre d'occurences: egrep -c "\bpatri(o|e)" duchn.txt
      le résultat obtenu est 292.

  9. contenant des mots qui parlent de « liberté »: egrep "\blibert" duchn.txt
    lien vers resultat
    • Nombre d'occurences: egrep -c "\blibert" duchn.txt
      le résultat obtenu est 231.

  10. contenant des mots qui parlent de « temps »: egrep "\btemp(o|s)" duchn.txt
    lien vers resultat
    • Nombre d'occurences: egrep -c "\btemp(o|s)" duchn.txt duchn.txt
      le résultat obtenu est 158.

  11. contenant des mots qui parlent de « république »: egrep "\br.publi(c|q)" duchn.txt
    lien vers resultat
    • Nombre d'occurences: egrep -c "\br.publi(c|q)" duchn.txt
      le résultat obtenu est 500.

  12. contenant des mots qui parlent de « trahison »: egrep "\btrahi" duchn.txt
    lien vers resultat
    • Nombre d'occurences: egrep -c "\btrahi" duchn.txt
      le résultat obtenu est 71.

  13. contenant des séquences de mots comportant une forme négative : ne...pas, n’...pas, ....:
    egrep "\bne\b|\bn'" duchn.txt
    lien vers resultat
    • Nombre d'occurences: egrep -c "\bne\b|\bn'" duchn.txt
      le résultat obtenu est 2134.




Exercice 2: Etude morphologique



Pour cet exercice nous avons travaillé avec ce dictionnaire.
Nous avons utilisé l'outil egrep et wc pour les commandes.
Les résultats ont été obtenus sous cygwin.



  • Combien de mots dans le fichier ?
    wc va compter le nombre de ligne.
    La commande est : wc -w dico.txt
    Le résultat obtenu est 138257.


  • Avec la commande egrep extrayez les mots se terminant par -able:
    La commande egrep utilisée est : egrep "able$" dico.txt
    lien vers resultat


  • Combien y a-t-il de mots terminés par -able ?
    A quelle(s) partie(s) du discours sont-il rattachés?
    La commande est : egrep -c "able$" dico.txt
    Le résultat obtenu est 497.
    Les mots extraits appartiennent sont des adjectifs et des noms du discours.


  • Combien y a-t-il de mots terminés par -eux ?
    A quelle(s) partie(s) du discours sont-il rattachés?
    La commande est : egrep -c "eux$" dico.txt
    le résultat obtenu est 369.
    Les mots extraits appartiennent sont des adjectifs et des noms du discours.


  • Quelle commande permet d'extraire à la fois les mots se terminant par -able et ceux se terminant par -ible ?
    La commande est : egrep "(a|i)ble$" dico.txt
    lien vers resultat