Encodages définis par l'iso/iec-10646

UCS-4

Encodage de tous les caractères de l'iso-10646 dans une taille fixe de 4 octets (séquences de mots de 32 bits de 00000000 à 7FFFFFFF)

UCS-2

Encodage des seuls caractères du plan BMP dans une taille fixe de 2 octets (séquences de mots de 16 bits).

Ces encodages sont plutôt utilisés comme encodages internes car certains caractères ne sont pas autorisés pour les noms de fichiers. De plus la plupart des applications existantes s'attendant à trouver des fichiers de caractères codés sur un octet risqueraient d'interprêter le deuxième octet de certains caractères comme caractère de contrôle.

Par exemple, le caractère [300D « coin droit »: ''] risque d'être interprété comme une séquence composée du caractère [30 « zéro »: '0'] suivi du caractère de contrôle [0D « retour chariot »]

Exemples d'encodage et illustration de la compatibilité:
nb bitsStandartNotation binaireCaractère
7ASCII1100001a
8ISO-8859-101100001a
16UCS-200000000 01100001a
32UCS-400000000 00000000 00000000 01100001a