Partie 2: CYGWIN

Sommaire
I.1) Exercice sur le "Père Duchesne"
I.2) Complément de l'exercice sur le "Père Duchesne"
II.1)Exercice analyse morphologique
II.2) Complément de l'exercice analyse morphologique

I.1)Exercice sur le "Père Duchesne"

Dans cette partie nous vous exposerons une liste de commandes permettant de filtrer les lignes suivantes.

Logiciel utilisé:Cygwin B20

Document utilisé: Père Duchesne

Q1. Commande qui permet de filtrer les lignes contenant les mots commençant par « citoy » .

Cliquez ici pour voir le résultat !

La commande egrep permet d'extraire les lignes contenant des mots commençant par "citoy" dans le texte "Duchn-isolatin.txt". L'expression régulière "\b" permet de signaler que le motif ("citoy") se situe en début de mot. On aura par exemple, "citoyen" ou "citoyenneté".

Q2. Commande qui permet de filtrer les lignes contenant les mots commençant par « aristo » .

Cliquez ici pour voir le résultat !

La commande egrep permet d'extraire les lignes contenant des mots commençant par "aristo" dans le texte "Duchn-isolatin.txt". L'expression régulière "\b" permet de signaler que le motif ("aristo") se situe en début de mot. On aura par exemple, "aristocrate" ou "aristocratie".

Q3. Commande qui permet de filtrer les lignes contenant les mots commençant par « bougre » .

Cliquez ici pour voir le résultat !

La commande egrep permet d'extraire les lignes contenant des mots commençant par "bougre" dans le texte "Duchn-isolatin.txt". L'expression régulière "\b" permet de signaler que le motif ("bougre") se situe en début de mot. On aura par exemple, "bougre" ou "bougres".

Q4. Commande qui permet de filtrer les lignes qui parlent des « Sans-culottes » .

Cliquez ici pour voir le résultat !

La commande egrep permet d'extraire les lignes qui parlent de "sans-culottes" dans le texte "Duchn-isolatin.txt". L'expression régulière "culotte" permet de trouver tous les mots dérivés de "sans-culottes". On aura par exemple, "sans-culotte" ou "sans-culotterie.".

Q5. Commande qui permet de filtrer les lignes contenant une majuscule.

Cliquez ici pour voir le résultat !

Le texte dans le fichier Duchn-isolatin.txt est écrit sans majuscule. Les majuscules sont représentées dans ce fichier par un "*". La commande egrep permet d'extraire les lignes contenant une majuscule dans le texte "Duchn-isolatin.txt". L'expression régulière "\*" permet de trouver toutes les majuscules. Le "\" permet d'annuler la fonction d'opérateur regexp au "*".

Q6. Commande qui permet de filtrer les lignes contenant des mots qui se terminent par « er » .

Cliquez ici pour voir le résultat !

La commande egrep permet d'extraire les lignes contenant des mots terminant par "er" dans le texte "Duchn-isolatin.txt". L'expression régulière "er\b" permet de signaler que le motif ("er") se situe en fin de mot. On aura par exemple, "implorer" ou "égorger".

Q7. Commande qui permet de filtrer les lignes contenant des mots qui parlent de «danger » .

Cliquez ici pour voir le résultat !

La commande egrep permet d'extraire les lignes qui parlent de "danger" dans le texte "Duchn-isolatin.txt". L'expression régulière "danger" permet de trouver tous les mots dérivés de "danger". On aura par exemple, "danger" ou "dangereuse.".

Q8. Commande qui permet de filtrer les lignes contenant des mots qui parlent de «patrie ».

Cliquez ici pour voir le résultat !

La commande egrep permet d'extraire les lignes qui parlent de "patrie" dans le texte "Duchn-isolatin.txt". L'expression régulière "patri" permet de trouver tous les mots dérivés de "patrie". On aura par exemple, "patriote" ou "patriotiques.".

Q9. Commande qui permet de filtrer les lignes contenant des mots qui parlent de « liberté » .

Cliquez ici pour voir le résultat !

La commande egrep permet d'extraire les lignes qui parlent de "liberté" dans le texte "Duchn-isolatin.txt". L'expression régulière "\blib" permet de signaler que le motif ("lib") se situe en début de mot. On aura par exemple, "libres" ou "liberté.".

Q10. Commande qui permet de filtrer les lignes contenant des mots qui parlent de « temps ».

Cliquez ici pour voir le résultat !

La commande egrep permet d'extraire les lignes qui parlent de "temps" dans le texte "Duchn-isolatin.txt". L'expression régulière "temps" permet de trouver tous les mots dérivés de "temps". On aura par exemple, "temps" ou "longtemps.".Dans ce fichier, le mot "temps" est utilisé comme "durée" ou comme "état de l'atmosphère".

Q11. Commande qui permet de filtrer les lignes contenant des mots qui parlent de « république ».

Cliquez ici pour voir le résultat !

La commande egrep permet d'extraire les lignes qui parlent de "république" dans le texte "Duchn-isolatin.txt". L'expression régulière "r.publi" permet de trouver tous les mots dérivés de "république". On aura par exemple, "républicains" ou "république.".Dans ce fichier, le mot et les accents sont représentés par des "."

Q12. Commande qui permet de filtrer les lignes contenant des mots qui parlent de « trahison ».

Cliquez ici pour voir le résultat !

La commande egrep permet d'extraire les lignes qui parlent de "trahison" dans le texte "Duchn-isolatin.txt". L'expression régulière "tra(h|-tr)" permet de trouver tous les mots dérivés de "trahison". On aura par exemple, "traître" ou "trahis.".

Q13. Commande qui permet de filtrer les lignes contenant des séquences de mots comportant une forme négative : ne...pas, n’...pas, etc.

Cliquez ici pour voir le résultat !

La commande egrep permet d'extraire les lignes comportant une forme négative dans le texte "Duchn-isolatin.txt". L'expression régulière "\bn['e]\b" permet de trouver tous les mots commençant par "n" suivie de "'" ou "e" et en fin de mot . On aura par exemple, "ne" ou "n'" suivi de son adverbe de négation "pas".


                                                                                                                               Retour Haut de page

I.2) Complément de l'exercice sur le "Père Duchesne"

Dans cette partie nous vous exposerons une liste de commandes permettant de filtrer les lignes suivantes.

Logiciel utilisé:Antconc

Document utilisé: Père Duchesne

Dans cette partie nous utilisons seulement les expressions régulières pour le logiciel Antconc.

Q1. Commande qui permet de filtrer les lignes contenant les mots commençant par "citoy".

Cliquez ici pour voir le résultat !

Q2. Commande qui permet de filtrer les lignes contenant les mots commençant par « aristo » .

Q3. Commande qui permet de filtrer les lignes contenant les mots commençant par « bougre » .

Q4. Commande qui permet de filtrer les lignes qui parlent des « Sans-culottes » .

Q5. Commande qui permet de filtrer les lignes contenant une majuscule.

Q6. Commande qui permet de filtrer les lignes contenant des mots qui se terminent par « er » .

Q7. Commande qui permet de filtrer les lignes contenant des mots qui parlent de «danger » .

Q8. Commande qui permet de filtrer les lignes contenant des mots qui parlent de «patrie ».

Q9. Commande qui permet de filtrer les lignes contenant des mots qui parlent de « liberté » .

Q10. Commande qui permet de filtrer les lignes contenant des mots qui parlent de « temps ».

Q11. Commande qui permet de filtrer les lignes contenant des mots qui parlent de « république ».

Q12. Commande qui permet de filtrer les lignes contenant des mots qui parlent de « trahison ».

Q13. Commande qui permet de filtrer les lignes contenant des séquences de mots comportant une forme négative : ne...pas, n’...pas, etc.


                                                                                                                               Retour Haut de page

II.1)Exercice analyse morphologique

Dans cette partie nous ferons l'analyse morphologique de ce corpus à l'aide des expressions régulières.

Logiciel utilisé:Cygwin B20

Document utilisé: Dico

Q1. Combien de mots dans le fichier ?

La commande "wc -c" permet de compter tous les mots du fichier "Dico.txt". Dans ce cas, le résultat est de 136252 mots.

Q2. Avec la commande egrep extrayez les mots se terminant par -able.

Cliquez ici pour voir le résultat !

La commande egrep -i "able\b" permet d'extraire tous les mots terminant par "-able" du fichier "Dico.txt".

Q3. Combien y a-t-il de mots terminés par -able ? A quelle(s) partie(s) du discours sont-il rattachés ?

La commande egrep -c "able\b" permet de compter tous les mots terminant par "-able" du fichier "Dico.txt". Dans ce cas le résultat est de 492 mots.
Le suffixe "-able" permet de former des adjectifs lorsqu'ils sont en fin de chaque nom ou verbe.

Q4. Avec la commande egrep extrayez les mots se terminant par -eux.

Cliquez ici pour voir le résultat !

La commande egrep -i "eux\b" permet d'extraire tous les mots terminant par "-eux" du fichier "Dico.txt".

Q5. Combien y a-t-il de mots terminés par -eux.

La commande egrep -c "eux\b" permet de compter tous les mots terminant par "-eux" du fichier "Dico.txt". Dans ce cas le résultat est de 363 mots.

Q6. Quelle commande permet d'extraire à la fois les mots se terminant par -able et ceux se terminant par -ible:

Cliquez ici pour voir le résultat !

La commande egrep "[ai]ble\b" permet d'extraire tous les mots terminant par "-able" et "-ible" du fichier "Dico.txt".


                                                                                                                               Retour Haut de page

II.2) Complément de l'exercice analyse morphologique

Dans cette partie nous ferons l'analyse morphologique de ce corpus à l'aide des expressions régulières.

Logiciel utilisé:Antconc

Document utilisé: Dico

Dans cette partie nous utilisons seulement les expréssions régulières pour le logiciel Antconc.

Q1. Combien de mots dans le fichier ?

Dès que nous ouvrons le fichier "dico.txt" sur le locigiel AntConc, il nous indique le nombre de mots dans "CONCORDANDE HITS". Dans ce cas nous avons 136252 mots pour le fichier "dico.txt".

Q2. Avec la commande egrep extrayez les mots se terminant par -able.

Q3. Combien y a-t-il de mots terminés par -able ?

Ces deux questions sont rassemblées car ce logiciel permet d'extraire et de compter. Dans "CONCORDANDE HITS" nous pouvons voir le nombre de mots terminant par "-able".

Q4. Avec la commande egrep extrayez les mots se terminant par -eux.

Q5. Combien y a-t-il de mots terminés par -eux.

Ces deux questions sont rassemblées car ce logiciel permet d'extraire et de compter. Dans "CONCORDANDE HITS" nous pouvons voir le nombre de mots terminant par "-eux".

Q6. Quelle commande permet d'extraire à la fois les mots se terminant par -able et ceux se terminant par -ible:


                                                                                                                               Retour Haut de page