Quelques exemples de langages de hauts niveaux


TeX

Le codage repose sur les 7 bits de l'ASCII. Les caractères supérieurs à 128 sont notés avec des codes de contrôle du type \nomDuCode. Par exemple pour la notation des accents il existe les codes contrôles : \' \^ \¨ etc. qui servent à noter les accents aigus, circonflexes, trémas, etc. De manière plus précise :
é s'écrit \'e
ô s'écrit \^o
ï s'écrit \¨i


RTF

Le codage repose sur les 7 bits de l'ASCII. Toutes les données de présentation sont inscrites explicitement sous forme de texte (en pur ASCII). Les caractères ASCII (< 128) restent inchangés. Les autres caractères sont transformés en codes de contrôle du type \'nn (où nn représente la valeur hexadécimale du caractère souhaité dans le jeu de caractères utilisé). Ou bien \u suivi de la position du caractère dans Unicode (par exemple: \u603 pour le caractère 'ɛ').

Exemple:

{\rtf1\ansi\ansicpg1252

	\pard\plain\b  {Conseil d'une chenille}
	\pard\plain{
		\par La Chenille et Alice se regard\'e8rent pendant un bout de temps. Enfin la chenille retira le calumet de sa bouche et demanda d'une voix languissante et ensommeill\'e9e :
		\par
		\par "Qui \'eates-vous?" dit Alice.
		\par
		\par Ce n'\'e9tait pas tr\'e8s encourageant. Alice r\'e9pondit timidement : "Je\'85 je ne sais pas trop, madame, pour le moment, \'85 en tout cas, je sais qui j'\'e9tais quand je me suis lev\'e9e ce matin, mais je crois avoir chang\'e9 plusieurs fois depuis.
		\par
		\par -Que voulez-vous dire? demanda s\'e9v\'e8rement la Chenille. Expliquez-vous!
		\par -Je ne peux pas m'expliquer moi-m\'eame, voyez-vous, dit Alice, parce que je ne suis plus moi-m\'eame.
		\par -Je ne comprends pas, dit la Chenille.
		\par -Je regrette de ne pas pouvoir m'expliquer plus clairement, r\'e9pondit Alice tr\'e8s poliment, car je ne comprends pas moi m\'eame, et changer si souvent de taille en une seule journ\'e9e, il y a vraiment de quoi vous troubler les id\'e9es.
		\par -Il n'y a pas de quoi, dit la Chenille.
		\par -Vous ne savez peut-\'eatre pas encore, dit Alice, mais quand vous serez chang\'e9e en chrysalide \emdash  et cela vous arrivera un jour, vous savez \emdash  et puis en suite quand vous deviendrez un papillon, vous trouverez \'e7a plut\'f4t bizarre, ne croyez-vous pas?
		\par -Pas du tout, r\'e9pliqua la Chenille.
		\par -C'est possible, vous changerez peut-\'eatre d'avis. Tout ce que je sais c'est qu'\'e0 moi, cela para\'eetrait bizarre.
		\par -Vous, dit la Chenille avec m\'e9pris. Qui \'eates-vous?
		\par
		\par Ce qui les ramena au commencement de leur conversation.
		\par
	}

}		


HTML

Déclaration de l'encodage dans l'entête HTTP:
Content-Type: text/html; charset=EUC-JP

Déclaration de l'encodage dans un tag META de l'entête HEADER du document HTML
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">

Un attribut charset existe pour certains éléments HTML (LINK, A, SCRIPT)
<SCRIPT charset="ISO-8859-1" TYPE="text/javascript" SRC="foo1.js"> javascript:alert('é')
<SCRIPT charset="ISO-8859-5" TYPE="text/javascript" SRC="foo5.js"> javascript:alert('é')

Mécanisme des entités: cf: XML


XML

Déclaration de l'encodage dans l'entête
<?xml version="1.0" encoding="iso-8859-1"?>
L'encodage peut être l'un des encodages ou transformations de iso-10646 comme: ISO-10646-UCS-2, ISO-10646-UCS-4, UTF-8, UTF-16, UTF-32,
Ou bien des jeux de caractères plus petits comme: US-ASCII, ISO-8859-1 à 15, etc. De nombreux encodages sont autorisés à partir du moment où les caractères qu'ils adressent existent dans ISO-10646.
 
Il est possible de coder un caractère qui n'est pas disponible dans le jeu de caractères déclaré au moyen d'entités caractères.
Une entité commence par le caractère '&' et se termine par le caractère ';' entre ces caractères il est possible de: