Commandes Unix

Ici un lien vers les exercices avec expressions régulières !

Emulations de système unix : Cygwin beta 20, Cygwin (inutile : nous travaillons sous Mac !)

pwd : afficher le nom du répertoire où l'on est, le répertoire courant. Le résultat est un chemin absolu. Sous Unix, il n'y a qu'une seule arborescence, qui commence par root : /, la racine.

cd : changer de répertoire

ls : afficher le contenu du répertoire courant

wc : word count, comptage dans les fichiers. Syntaxe : wc nomdufichier.txt On peut introduire des options aux commandes, entre espaces entre wc et le nom du fichier. Résultat par défaut : nombre de lignes, nombre de mots, nombre de caractères. Avec options : -l lignes -w mots -c caractères

egrep : egrep "truc recherché" nomdufichier
Par défaut elle affiche les lignes qui contiennent le motif (truc recherché). Le motif peut/doit être une expression régulière. \bcitoy = mots qui commencent par citoy
options pour egrep : -c  compter les lignes qui contiennent le motif (et non pas les afficher) 
-i  rechercher le motif sans tenir compte de la casse des caractères
-n affiche les lignes qui contiennent le motif précédées de leur numéro
-v affiche les lignes qui ne contiennent PAS le motif
-o affiche toutes les occurrences de chaînes de caractères reconnues par le motif

Redirection du flux de sortie d'une commande :
> : le chevron est un mécanisme qui redirige ce flux dans un fichier. Il faut le rajouter à la fin de la commande et rajouter un nom de fichier. Attention à bien varier le nom du fichier de résultats.
| : trait vertical, envoie le flux de sortie d'une commande vers une autre commande. On peut empiler des fichiers. Exemple :
egrep "\bcitoy" Duchn-isolation.txt | egrep "boue"  -> on cherche les lignes qui ont des mots commençant par citoy, et puis on cherche parmi ces lignes celles qui ont boue.

XML Structuré

Ici un lien vers le travail XML !

Créer son propre code xml ?

DTD : Document Type Definition : syntaxe, grammaire qui explique la hiérarchie de notre arborescence xml.
Mais d'abord on va dessiner une modélisation ! Une modélisation uml = Unified Markup Language. Il s'agit d'une représation de la hiérarchie sous forme d'objets et de liens entre eux.
Il faut définir tout ça AVANT de faire le code.

Dans le TLFi, j'ai choisi le thème du poison ; les mots sont donc arsenic, ciguë, cyanure, strychnine...