Quel est le but de la noncharacters U+FDD0 à U+FDEF?
U+FFFE doit être un caractère, afin de permettre à la Marque d'Ordre d'Octet de travail.
U+FFFF est décrit dans Le Standard Unicode "utile à des fins internes, comme des sentinelles". Du sens.
Mais je ne peux pas comprendre, et Le Standard Unicode n'est pas vraiment expliquer pourquoi l'ensemble de noncharacters comprend un hasard bloc au sein de "l'arabe de Formulaires de Présentation-Un". Ce sont ces pour? (D'ailleurs l'œil du basilic?)
- Soin d'expliquer la bande dessinée?
- vérifiez le texte de la bande dessinée. (passez la souris/info-bulle)
Vous devez vous connecter pour publier un commentaire.
OK la question est: "quels sont-ils et Pourquoi sont-ils dans le milieu de l'arabe, Présentation des Formes".
http://www.unicode.org/mail-arch/unicode-ml/y2001-m10/0014.html
Par conséquent, il a été convenu que ces codepoints, qui n'ont jamais été destiné à être utilisé autrement, serait désigné noncharacters afin qu'ils puissent être utilisés à l'interne par les applications/programmeurs.
Ces noncharacters sont pour un usage interne et ne sont pas interchangeables.
J'ai essayé d'expliquer basé sur ce qui est dit dans le standard Unicode.
Unicode a obtenu 66 non-caractères. Pour tous les 17 plans qu'ils ont deux chacune, deux derniers points de code de l'avion se terminant avec FFFE FFFF. 32 a pas d'autres caractères sont bloc continu U+FDD0 à U+FDEF.
Donc nombre total
Lire la suite du texte à partir de l'unicode chapitre 16, qui dit que ses aléatoire, dans certains endroit en raison de la "raison historique", je suis curieux, mais je ne pense pas qu'il y a une ambiguïté.
U+FEFF
est de la NOMENCLATURE etU+FFFE
est d'octets échangés version de celui-ci. Mais depuisU+FFFE
est un caractère, lorsqu'un processus d'interprétation, trouve U+FFFE comme premier caractère, il signale que le processus a rencontré le texte c'est de la mauvaise octet de commande ou que le fichier n'est pas valide Unicode texte, Il donne juste un signal, pas d'une manière standard. Il peut être soit de l'un, inverser les octets ou un mauvais texte.Dans l'Unicode la section 3.2 clause C2 dit
De sorte que les développeurs d'applications, vous êtes libre d'utiliser ces caractères comme vous le souhaitez. Ils sont utilisés comme sentinelles ou delimter ou peut-être certains baslik personnages, mais ils ne doivent pas être interchangeables.
Section 16.7 dit
Nouveau U+FFFF n'est pas réservé que les sentinelles par le standard Unicode, mais simplement le cas d'utilisation typique. Lire dans section 16.7
Comme mentionné ici, à xkcd,
U+FDD0
est en fait le caractère Unicode pour l'œil d'un basilic. Pour (évident) des raisons de sécurité personnelle toutefois, le caractère n'est pas affichée à l'écran... 🙂