Qu'est-ce que l'encodage & décodage dans la communication?

Quelqu'un peut-il svp me diriger vers quelques bonnes références à propos de l'encodage et de décodage dans la communication et les différentes techniques de codage(unicode, base64, utf7) etc.

InformationsquelleAutor Rise | 2010-03-15

character-encoding encoding

2

Wikipédia est toujours un bon début.

Puis, il y a toujours Joel Spolsky de l'article: Le Minimum Absolu que Tout Développeur Doit Absolument, Positivement Savoir Sur Unicode et les Jeux de Caractères (Pas d'Excuses!).

Noter que les trois choses que vous nom de fonctionner sur différents niveaux.
- Unicode est un jeu de caractères: une correspondance entre les lettres et les chiffres (points de code).
- UTF7 cartes entre les points de code et d'octets.
- base64 cartes entre les octets et les octets. (Il mangles octets, de sorte qu'ils sont représentés par des octets dans la plage ASCII.)
- - Bon lien de référence et une courte description de chaque concept. Merci
InformationsquelleAutor Thomas
1

Les définitions de codage et de décodage sont un peu subjective.

Les deux sont des formes de translittération, étant le processus de conversion d'un alphabet à l'autre. ASCII en UTF8, ASCII en base64, etc sont tous des exemples de cette.

Ce qui distingue les deux est que "codage" est souvent utilisé lors de transliterating à partir d'un format utilisable pour une transmission ou de format intermédiaire d'un certain genre et de décodage, c'est l'inverse. C'est là que le "subjectif" peu arrive. ASCII pour de l'utf-8 peut être considérée comme de codage et de décodage en fonction du contexte.

D'autres formats, comme base64 sont utilisé universellement pour la transmission uniquement (par exemple, des données binaires dans l'email) et en tant que telle conversion est presque universellement appelé "encodage" et de la conversion de que "décodage".

Le point important à tirer de tout cela est que quelque chose comme ASCII ou UTF-8 n'est pas magique en quelque sorte. Tous ces formats sont tout simplement d'un commun accord lors de l'encodage de l'information dans un format binaire. Donc ASCII 65 est 'A' pour aucune autre raison que c'est la norme.

Formats Unicode obtenir plus intéressants parce qu'ils font la distinction entre les point de code et la encodage. Unicode définit le code des points pour chaque personnage. Les données binaires sont différents pour chaque format de codage. Voir, par exemple, Caractère Unicode 'EURO-MONNAIE de SIGNE" (U+20A0) pour voir toutes les différentes valeurs binaires pour un seul point de code.

InformationsquelleAutor cletus
0

Concernant la vôtre unicode, base64, utf7 (personne ne l'utilise, il peut être utf8). Ils ne sont pas seulement des "encoding & décodage" mais l'encodage & décodage de données de texte.

Unicode est la façon dont tous les vrais et les caractères possibles sont énumérés. Il n'a rien sur le codage lui-même. UTFXX est l'ensemble de l'encodage unicode (code de conversion d'octets). les plus populaires sont UTF8 et UTF16. Très fondamentalement UTF8 est compatible ASCII (caractères avec les codes < 128 sont représentés de la même manière que ASCII), mais d'autres personnages sont représentés par 2 ou 3 octets. UTF16 encoder la plupart des caractères de 2 octets.

Base64 n'a rien à propos des données de texte. Il code binaire générique de données de texte qui se compose de 64 caractères ascii imprimables. Il est utilisé pour transférer des données binaires, UTF8 et UTF16 via Courriel.

InformationsquelleAutor Andrey

Vous devez vous connecter pour publier un commentaire.