Unicode fichier dans le bloc-notes
Ce que signifie-t-il lorsque j'enregistre un fichier texte Unicode" dans le bloc-notes? c'est de l'Utf-8, Utf-16 ou Utf-32? Merci à l'avance.
Probablement UTF-8, qui est la plus commune.
Linuxios, mais il est un autre choix nommée Utf-8 dans le bloc-notes enregistrer le fichier !! Comment pourrait être dupliqué ??
double possible de qu'est-Ce que Java est l'équivalent de bloc-notes de Windows "Unicode"?
Linuxios, mais il est un autre choix nommée Utf-8 dans le bloc-notes enregistrer le fichier !! Comment pourrait être dupliqué ??
double possible de qu'est-Ce que Java est l'équivalent de bloc-notes de Windows "Unicode"?
OriginalL'auteur FSm | 2012-12-15
Vous devez vous connecter pour publier un commentaire.
Dans le bloc-notes, comme dans Windows logiciel en général, “Unicode” comme un nom d'encodage signifie UTF-16 Little Endian (UTF-16LE). (J'ai d'abord pensé qu'il n'est pas réel UTF-16, parce que Notepad++, il reconnaît que l'UCS-2 et affiche le contenu comme des déchets, mais re-vérifier avec BabelPad, j'en ai conclu que le bloc-notes peut encoder même les non-BMP correctement les caractères.)
De même, “Unicode big endian” signifie UTF-16 Big-Endian. Et “ANSI” signifie que le système natif de l'héritage de codage, par exemple, la 8-bits de windows-1252 encodage dans l'Ouest versions de Windows.
UTF-16 et UTF-8 couvrent exactement les mêmes caractères; ils sont tout deux de transfert de l'encodage Unicode. Windows utilise le nom “Unicode” pour l'UTF-16 juste parce qu'il utilise en interne UTF-16 pour l'Unicode.
Chaque UTF peut coder tous les caractères Unicode.
Jukka K. Korpela, je fais face à une langue Indo - Eroupian langue appelée langue Kurde. afin de bien le traitement de texte, quel genre de Unicode je dois enregistrer mon fichier ? l'Unicode ou UTF-8?? sont-ils de même?
toute raisonnable de traitement de texte logiciel peut lire à la fois l'UTF-16 (Windows “Unicode”) et UTF-8 et les convertir à sa représentation interne si nécessaire. Si vous écrivez votre propre code de programme, il vous suffit de sélectionner l'entrée routines de lecture à partir d'une bibliothèque. Donc il n'a pas vraiment beaucoup d'importance. Windows logiciel en interne utilise UTF-16. Mais pour les pages web, UTF-8 (UTF-16 est mal supporté par les navigateurs et les moteurs de recherche).
OriginalL'auteur Jukka K. Korpela
Tous ces formats sont "Unicode". Mais généralement, les éditeurs sur Mac et Windows signifie UTF-8 avec cela, car il est compatible ASCII ci-dessous le code 128 IIRC. UTF-8 peut représenter plus de codes que de simplement 256 (ce qui correspond à un octet de 8 bits) en utilisant des caractères spéciaux qui signifie que l'octet suivant appartient aussi à la même caractère.
Si vous chercher à la sortie du terminal, dire avec vi, et si vous voyez un espace entre chaque groupe de deux caractères, alors vous êtes à la recherche à l'UTF-16, car il y a tous les deux octets faire jusqu'à un caractère. Ce que vous devez voir, c'est que les personnages n'ont pas les espaces entre eux, c'est une indication pour l'UTF-8.
... parce que Windows est bizarre. Lorsque Windows a commencé à la pointe de ses orteils dans unicode ils ont d'abord adopté UTF16 (voir l'autre réponse) et a appelé cela "Unicode". Bien que sur le long terme UTF8 commencé à être utilisé partout et est devenu le standard de facto.
OriginalL'auteur Cocoanetics