Partie 1 - Commandes Unix:



Dans une première partie, nous avons travaillé sur un texte s'intitulant "le Père Duchesne" avec une commade Unix: egrep grâce à un émulateur: Cygwin Bash Shell et AntConc.

Cette commande nous permet, de rechercher dans des fichiers:

  • Une chaîne de caractères
  • Un mot
  • Une chaîne formalisée par une expression régulière

Pour cela, il faut l'utiliser avec une syntaxe précise de la commande: egrep [options] "chaîne recherchée" "fichier".

Enfin, le résultat affiché sera soit les lignes du fichier contenant ce qui est recherché soit ce qui est recherché suivant les options utilisées.

Exercices text brut

Exercices analyse morphologique


Partie 2 - XML Structuré:



Dans cette deuxième partie, nous avons ttravillée avec la norme XML, un outil permettant de définir un langage, qui permet de créer des documents structurés à l'aide de balises. Un document XML est structuré en trois parties:

Une première partie, appelée prologue, qui permet d'indiquer la version de la norme XML utilisée pour créer le document ainsi que le jeu de caractère utilisé dans le document.

Une deuxième partie, nommée DTD, une déclaration de type de document

Une troisième partie qui se présente sous la forme d'un fichier XML: l'arbre des éléments

Exercices dictionnaire