Outil pour traduire les codes Unicode. Unicode est une norme de codage des caractères informatiques visant à donner à tout caractère un identifiant numérique.
Codage Unicode - dCode
Catégorie(s) : Codage de Caractères, Internet
dCode est gratuit et ses outils sont une aide précieuse dans les jeux, les maths, les énigmes, les géocaches, et les problèmes à résoudre au quotidien !
Une suggestion ? un problème ? une idée ? Écrire à dCode !
Unicode est un système de codage informatique qui a pour but d'unifier les échanges de texte au niveau international. Avec Unicode, chaque caractère informatique est décrit par un nom et un code (point de code ou codepoint), l'identifiant de manière unique quel que soit le support informatique ou le logiciel utilisé. Unicode a déjà répertorié plus de 100000 caractères.
Parmi les premiers caractères Unicode, il y a les 128 codes ASCII (dont l'alphabet latin), puis l'alphabet phonétique international, puis les alphabets locaux (grec, cyrillique, etc.) puis des symboles et bien d'autres.
Un message encodé par Unicode est composé de nombres qui sont automatiquement traduit à l'écran en caractères affichables pour l'utilisateur (via UTF-8 ou UTF16).
Il est possible de chiffrer un message en affichant les codes Unicode de chacun des caractères du message.
Exemple : Soit message DCΦD€ (le mot DCODE mais avec une lettre phi Φ et un symbole euro €)
Chaque caractère est en réalité codé informatiquement ainsi :
Caractère affiché | Code Unicode | Code Unicode Hexadecimal |
---|---|---|
D | 68 | 44 |
C | 67 | 43 |
Φ | 934 | 03A6 |
D | 68 | 44 |
€ | 8364 | 20AC |
Les identifiants numériques Unicode, à l'instar de l'ASCII, sont régulièrement affichés au format hexadécimal pour une écriture plus concise.
Pour effectuer la traduction d'un message Unicode, réassocier à chaque code identifiant, son caractère Unicode.
Exemple : Le message 68,67,934,68,8364 se traduit individuellement par nombre : 68 => D, 67 => C, etc. afin d'obtenir DCΦD€.
Le message est composé de nombres (format décimal ou hexadécimal, plus rarement binaire). Pour un texte composé de lettres issues de l'alphabet latin, les nombres entre 64 et 122 (correspondant aux codes ASCII et Unicode des lettres A-Z et a-z) seront les plus fréquents.
UTF-8 est un système de codage 100% compatible avec Unicode, qui a l'avantage d'être rétro-compatible avec l'ASCII. UTF8 est utilisée sur plus de 90% des sites internet.
UTF16 une variante d'encodage sur 16 bits, utilisé par Windows.
UTF32 est une autre variante, encore peu utilisée.
Le site officiel de l'Unicode Consortium est ici
dCode se réserve la propriété du code source pour "Codage Unicode". Sauf code licence open source explicite (indiqué Creative Commons / gratuit), l'algorithme pour "Codage Unicode", l'applet ou snippet (convertisseur, solveur, chiffrement / déchiffrement, encodage / décodage, encryptage / décryptage, traducteur) ou les fonctions liées à "Codage Unicode" (calculer, convertir, résoudre, décrypter / encrypter, déchiffrer / chiffrer, décoder / encoder, traduire) codés en langage informatique (Python, Java, C#, PHP, Javascript, Matlab, etc.) ou les données, en téléchargement, script, ou les accès API à "Codage Unicode" ne sont pas publics, idem pour un usage hors ligne, PC, mobile, tablette, appli iPhone ou Android !
Rappel : dCode est gratuit.
Le copier-coller de la page "Codage Unicode" ou de ses résultats est autorisée (même pour un usage commercial) tant que vous créditez dCode !
L'exportation des résultats sous forme de fichier .csv ou .txt est gratuite en cliquant sur l'icone export
Citer comme source bibliographique :
Codage Unicode sur dCode.fr [site web en ligne], consulté le 21/12/2024,