Commandes Unix

Nous avons ici travaillé sur le texte du Père Duchesne. Les exercices consistent à filtrer des lignes précises.

Les résultats des commandes seront tous affichés dans un document .txt à la fin de cette page!

Dans un deuxième lien vous pourrez voir les résultats obtenus pour les mêmes commandes avec le logiciel Antconc.



Écrire une commande qui permet de filtrer les lignes contenant des mots commençant par « citoy ».

Écrire une commande qui permet de filtrer les lignes contenant des mots commençant par « aristo ».

Écrire une commande qui permet de filtrer les lignes contenant des mots commençant par « bougre ».

Écrire une commande qui permet de filtrer les lignes qui parlent des « Sans-culottes ».

Écrire une commande qui permet de filtrer les lignes contenant une majuscule.

Écrire une commande qui permet de filtrer les lignes contenant des mots qui se terminent par « er ».

Écrire une commande qui permet de filtrer les lignes contenant des mots qui parlent de « danger ».

Écrire une commande qui permet de filtrer les lignes contenant des mots qui parlent de « patrie ».

Écrire une commande qui permet de filtrer les lignes contenant des mots qui parlent de « liberté ».

Écrire une commande qui permet de filtrer les lignes contenant des mots qui parlent de « temps ».

Écrire une commande qui permet de filtrer les lignes contenant des mots qui parlent de « république ».

Écrire une commande qui permet de filtrer les lignes contenant des mots qui parlent de « trahison ».

Écrire une commande qui permet de filtrer les lignes contenant des séquences de mots comportant une forme négative : ne...pas, n’...pas, etc.






Le lien vers les résultats

Les résultats Antconc



Maintenant nous allons faire un exercice d'analyse morphologique.

Pour cette partie il n'y a pas de document .txt avec l'intégralité des résultats mais un échantillon du résultat montré par capture d'écran.



Combien y a-t-il de mots dans le fichier ?

Avec la commande egrep extrayez les mots se terminant par -able.

Combien y a-t-il de mots terminés par -able ? A quelle(s) partie(s) du discours sont-il rattachés ?



Combien y a-t-il de mots terminés par -eux ? A quelle(s) partie(s) du discours sont-il rattachés ?



Quelle commande permet d'extraire à la fois les mots se terminant par -able et ceux se terminant par -ible ?







XML Structuré

Pour finir nous allons structurer un document!

J'ai choisi dix définitions originales sur le twitter "1Jour1mot" puis j'ai créé une grammaire pour organiser mon mini-dictionnaire.



Mes définitions:

Fumer sans pipe (loc.) : [Fig. vieux] : Être en colère. Ex. : Il n'est pas seulement énervé, il fume sans pipe.

Agonir (v.tr.) : [Rare] Injurier, insulter. Ex.: Il s'est fait agonir.

Pince-fesse/Pince-fesses (n.m. Inv.) : [Fam., péjor.] Bal, surprise-partie, réception où les invités se tiennent mal.

Ganache (n.f.) : [Fig. fam.] Personne incapable, sans intelligence, bornée. Syn. : imbécile, incapable.

Guide-âne (n.m.) : Aide-mémoire, fascicule contenant des instructions pour les débutants // Transparent réglé aidant à écrire droit.

Croque-note / Croquenote (n.m.) : [Fam.] Musicien sans talent & sans ressource.

Songe-creux (n. m. inv.) : [Littér.] Personne se complaisant dans les rêveries, les chimères.

Pouloper (v.intr.) : [Argot] Faire de nombreuses allées et venues ; se dépêcher, s'agiter. De l'anglais « pull up ».

Flânocher (v.i.) : [Rare] Flâner, se balader.

Tata (n.f.) : [Vieux] Femme qui se mêle de tout, qui fait l'importante // Femme d'âge mûr, assez corpulente, d'allure peu élégante.



Voici mon arborescence:

Ainsi que la version textuelle de mon arbre:




Le lien vers mon mini-dictionnaire une fois organisé.