Partie 2: Modélisation XML

Retour accueil        Partie 1         Partie 2


Commande Unix


Dans un premier temps, nous avons à l'aide d'un texte (celui du Père Duchesne) filtré un certain nombre de lignes en fonction de ce que nous voulons voir apparaître.

2

Résultat:

résultat 2

   - filtrer les contenant des mots commençant par « bougre »

3

 
- filtrer les lignes qui parlent des « Sans-culottes » .

4

Résultat:

résultat 4

  -
filtrer les lignes contenant une majuscule:

5

Résultat:

5em

  
- filtrer les lignes contenant des mots qui se terminent par « er » :

eme

Résultat :

résulte 6

  
- filtrer les lignes contenant des mots qui parlent de «danger » :

7

Résultat :

résult 7

8

Résultat:

result8

9
10

Résultat:
result 10
11

12

13

Dans un second temps, nous allons faire une étude portant sur une analyse morphologique.

a) Combien de mots dans le fichier ?


photo 1

En tapant la commande ci-dessus nous trouvons que le fichier comporte 136250 mots.

 

 b) Avec la commande egrep extrayez les mots se terminant par -able. Combien y a-t-il de mots terminés par -able ?

photo 2


egrep « able\b » dico.txt\wc -l cela permet d'extraire les mots terminant par « able »

Nous savons qu'il y a  492 mots se terminant par « able » dans le document grâce à la commande ci-dessus.

c)    Même question pour -eux.


33

Pour trouver combien de mots se terminent par -eux , on écrit les mêmes codes et on remplace « able » par « eux ». Il y a 363 mots qui se terminent par « -eux ».

 Nous avons extrait les mots finissant par « able » et par « ible » ce qui nous donne le résultat suivant:

d) Quelle commande permet d'extraire à la fois les mots se terminant par -able et ceux se terminant par -ible

photo 4

Ceci grâce à la commande suivante :

ible

XML Structuré

Ici, nous avons sellectionné 10 mots dans le dictionnaire un jour un mot de twiter disponible sur ce lien. En voici la liste :

Quibus (n.m.) : [Vieux, pop.] Argent, fortune. Ex.: Avoir du quibus. Manquer de quibus.

Alacrité (n.f.) : [Litt.] Gaieté vive, entraînante. Synon. : entrain, vivacité, allégresse. Du latin alacritas, "vivacité".

Piaffe (n.f.) : [Vieux, fam.] Ostentation, vaine somptuosité, luxe tapageur, désir d'éblouir.

Garrulité (n.f.) : Cri d'un oiseau // [Fig., littér.] Bavardage immodéré.

Déduit (n.m.) : [Vieux] Divertissement, récréation, occupation procurant du plaisir.

Cauteleux (adj.) : Qui agit de façon détournée et sournoise. Syno. : hypocrite, sournois.

Anomie (n. f.) : Désorganisation sociale résultant de la disparition des valeurs communes dans un groupe, une société.

Ahonter (v.tr.) : [Vieux] Couvrir quelqu'un de honte. Syn.: Honnir.

Philippique (n.f.) : [Littér.] Discours ou écrit violent contre une personne. Antonyme : Apologie.

Brême : [XIXe] Carte à jouer, d'où maquiller les brêmes, truquer les cartes.


Voici la structure écrite de mon dictionnaire:

dico
 Ci-dessous, la mise en arbre de mon dictionnaire:
arborescence