Partie 2:CYGWIN                                                                                               FINDEPAGE

Sommaire

I.1)Exercice avec le Père Duchesne
I.2)Complément de l'exercice sur le "Père Duchesne"
II.1)Analyse morhologique

II.2)Complément de l'analyse morphologique


Exercice 1

Nous travaillons donc sur le fichier duchn.txt

Voici les commandes permettant de filtrer les lignes:

Pour les mots commençant par:
Pour voir les résultats des commandes cliquez sur les mots en violet
-«citoy»: egrep  «\bcitoy » duchn.txt



-
«aristo»: egrep «\baristo» duchn.txt



-
«bougre»:egrep « \bbougre» duch.txt


Contenant des mots qui parlent de:

-
«Sans-culottes»: egrep «culotte» duchn.txt



Contenant une majuscule: egrep«\*»duchn.txt  (traduitparuneastérisque)



Contenant les mots qui se terminent par «er»:egrep « er\b » duchn.txt


Contenant des mots qui parlent de:
-«danger»: egrep«\bdanger» duchn.txt


-«patrie»: egrep «patri» duchn.txt
 


-«liberté»: egrep «\blib»duchn.txt
 


-
«temps» egrep «temp(s|o)»duchn.txt


-
«république» egrep«r.publi» duchn.txt


-«trahison»: egrep «tra(h|.tr)»duchn.txt


Contenant des séquences des mots comportant une forme négative: on recherche des formes tels que :ne...pas,n'...pas. egrep «\bn['e]\bduchn.txt»


II)Etude morphologique

Dans cette partie nous verrons avec certaines commandes comment filtrer des lignes avec le logiciel:Antonc

Toujours sur le même texte:Père Duchesne ,nous utiliserons seulemement nos expressions régulières avec ce logiciel.

Commande qui permet de filtrer les lignes où se trouve les mots commençant par "citoy":
Question1
Pour consulter le résultat, cliquez ici!=)
Commande qui permet de filtrer les lignes où se trouve les mots commençant par "aristo":             

HAUTDEPAGE


Question 2



Commande qui permet de filtrer les lignes où se trouve les mots commençant par:"bougre".
Question 3




Commande qui permet de filtrer les lignes qui parlent des "Sans-culottes".                                          EXOARISTO 
Question4




Commande qui permet de filtrer les lignes contenant une majuscule.
Question5


Commande qui permet de filtrer les lignes contenant des mots finissant par "-er".                     
Question6


Commande qui permet de  filtrer les lignes contenant des mots qui parlent de "danger":       
Question7
Commande qui permet de filtrer les lignes contenant des mots qui parlent de "patrie" Question8

Commande qui permet de filtrer les lignes contenant des mots qui parlent de ''liberté''.Question9
              EXOER
    


Commande qui permet de filtrer les lignes contenant des mots qui parlent de "temps".
Question10

 

Commande qui permet de filtrer les lignes contenant des mots qui parlent de "république".
Question11

  Commande qui permet de filtrer les lignes contenant des séquences de mots comportant une forme négative:ne...pas,n'...pas.Question 13                                                                                                                           EXODANGER
II.1)Analyse morphologique                                                                                               
Dans cette partie nous réalisons une analyse morphologique du corpus à l'aide d'expressions régulières.Le logiciel utilisé est :CygwinB20. Et nous baserons sur le fichier: dico.txt

Q1.Combien y a-t-il de mots dans le fichier?
 
 
La commande "wc-c" permet de compter tous les mots du fichier "Dico.txt".Nous obtenons ce résultat :136252 mots.
Q2.Avec la commande egrep extrayez les mots se terminant par -able.
Pour voir le résulat cliquez ici!
La commande egrep -i "able\b" permet d'extraire tous les mots se terminant "-able" du fichier " Dico.txt". Q3- Combien y-a-t-il de mots terminés par-able?A quelle(s) partie(s) du discours sont-ils rattachés?

La commande egrep-c "able\b" permet de compter tous les mots terminant par "able" du fichier "dico.txt". Notre résultat obtenu:492 mots.Le suffixe "-able" peut former des adjectifs lorsqu'ils sont en fin de mot et en fin de verbe.

Q4. Avec la commande egrep extrayez les mots se terminant par -eux.

Pour le résultat cliquez ici!

La commande egrep -i "eux\b" permet d'extraire tous les mots terminant par "-eux" du fichier "Dico.txt".

Q5. Combien y a-t-il de mots terminés par -eux.

La commande egrep -c "eux\b" permet de compter tous les mots terminant par "-eux" du fichier "Dico.txt". Dans ce cas le résultat est de 363 mots.

Q6. Quelle commande permet d'extraire à la fois les mots se terminant par -able et ceux se terminant par -ible:

Pour le résultat cliquez ici!

La commande egrep "[ai]ble\b" permet d'extraire tous les mots terminant par "-able" et "-ible" du fichier "Dico.txt".

II.2)Complément de l'analyse morphologique

Dans cette partie nous réaliserons l'analyse morphologique du corpus à l'aide de nos expressions régulières.Nous utiliserons le logiciel Antonc.Le fichier utilisé est le dico.txt Q1.Combien de mots dans le fichier?
A l'ouverture du fichier "dico.txt" dans le logiciel Antconc, nous remarquons  qu'il nous indique le nombre de mots dasn Concordancehits".Nous avons donc 1362452 mots pour le fichier "dico.txt"

Q2.Avec la commande egrep extrayez les mots se terminant par -able?Q3 Combien yat-il de mot terminés par-able?
(Ici nous pouvons rassembler ces deux questions car notre logiciel y répond.)






Q4 .Avec la commande egrep extrayez les mots se terminant par -eux.Q5. Combien y a t-il de mots terminés par -eux:




Q6.Quelle commande permet d'extraire à la fois les mots se terminant  par-able et ceux se terminant par -ible:





Parti2CYGWIN