Résultats de la partie (SF)

Pour cette partie de Serges Fleury, on utilisera Cygwin pour nos commandes. Il s'agira de travailler sur un texte qui est « Père Duchesne »

pour le texte cliquez ici

On utilisera des commandes de filtrages selon les questions posées

Exercice n°1

Question n°1: pour filtrer les lignes contenant des mots commençant par « citoy ».

commande :

résultats

Question n°2: pour filtrer les lignes contenant des mots commençant par « aristo ».

commande :

résultats

Question n°3: pour filtrer les lignes contenant des mots commençant par « bougre ».

commande :

résultats

Question n°4: pour filtrer les lignes qui parlent des « Sans-culottes ».

commande :

résultats

Question n°5: pour filtrer les lignes contenant une majuscule ( au format des majuscules dans le texte)

commande :

résultats

Question n°6: pour filtrer les lignes contenant des mots qui se terminent par « er ».

commande :

résultats

Question n°7: pour filtrer les lignes contenant des mots qui parlent de «danger ».

commande :

résultats

Question n°8: pour filtrer les lignes contenant des mots qui parlent de «patrie ».

commande :

résultats

Question n°9: pour filtrer les lignes contenant des mots qui parlent de « liberté ».

commande :

résultats

Question n°10: pour filtrer les lignes contenant des mots qui parlent de « temps ».

commande :

résultats

Question n°11: pour filtrer les lignes contenant des mots qui parlent de « république ».

commande :

résultats

Question n°12: pour filtrer les lignes contenant des mots qui parlent de « trahison ».

commande :

résultats

Question n°13: pour filtrer les lignes contenant des séquences de mots comportant une forme négative comme ne...pas, n’...pas

commande :

résultats

Exercice n°2

A présent, il s'agira de faire une étude morphonologique. Pour cela on utilisera deux documents nommés dico et dico-etiquette

pour le texte dico cliquez ici

pour le texte dico etiquette cliquez ici

On va toujours utiliser des commandes de Cygwin pour voir plusieurs choses

Question n°1: pour compter le nombre de mots dans le fichier on utilisera la commande ci-dessous

commande :

résultats

Question n°2: avec la commande egrep on va extrayez les mots se terminant par -able.

commande :

résultats

Question n°3-1: on va voir à présent la commande qui nous donnera combien il y a de mots qui se terminent par -able.

commande :

résultats

Question n°3-2: avec cette commande on verra à quelles parties du discours ces mots, trouvés à la question précédente, sont rattachés.

commande :

résultats

Question n°4-1: on va voir à présent la commande qui nous donnera combien il y a de mots qui se terminent par -eux.

commande :

résultats

Question n°4-2: avec cette commande on verra à quelles parties du discours ces mots, trouvés à la question précédente, sont rattachés.

commande :

résultats

Question n°5: la commande qu'on va voir maintenant va permettre d'extraire à la fois les mots se terminant par -able et ceux se terminant par -ible.

commande :

résultats

Exercice n°3

Cette fois-ci l'exercice consiste à contruire un document structuré en xml à partir de dix mots du dictionnaires qu'on aura extraits du TLFi

Pour commencer il faut choisir dix mots que nous souhaitons

mes choix

Ensuite il faut construire un arbre qui représenterait l'arborescence de nos choix

A présent grace à Notepad++ on va essayer de construire un document structuré (XML)

Voilà ce qu'on obtient en ouvrant la page avec un navigateur internet

Pour voir le détail : cliquez ici