iconv: Convertir de CP1252 de l'UTF-8
Je suis en train de convertir la CP1252 chaîne codée Çàïèñêè ýêñïåäèòîðà de l'UTF-8. J'ai essayé cette commande:
iconv -c -f=WINDOWS-1252 -t=UTF-8 test.txt
Pas de chance, l'obtention de certains résultats étranges:
ÊÀÇÀÃÃœ ÃÎà ÛÉ à Ã...Ê
J'ai essayé d'entrer dans la même chaîne (Çàïèñêè ýêñïåäèòîðà) ici, et ils sont en mesure de le convertir sans problèmes:
http://www.artlebedev.ru/tools/decoder/
Ce qui ne va pas?
OriginalL'auteur Somebody | 2013-03-15
Vous devez vous connecter pour publier un commentaire.
Lorsque vous convertissez CP1252 chaîne codée
Çàïèñêè ýêñïåäèòîðà
de l'UTF-8 avec la commandeiconv.exe -f CP1252 -t UTF-8 test.txt >testout.txt
ensuite le fichier sourcetest.txt
(Hex:) sera converti en fichier cible
testout.txt
(Hex:) qui est l'UTF-8 du code de
Çàïèñêè ýêñïåäèòîðà
.Même les ordures que vous mettez dans l'autre extrémité à l'extérieur. iconv du comportement est correct et comme prévu.
Ce que vous êtes perplexe, c'est que vous ne voyez pas ce que vous attendez et c'est parce que votre entrée 8bit chaîne est en fait codé en Windows-1251 (Cyrillique) Codepage.
→ Donc la bonne page de code n'est pas CP125
2mais CP1251 ←Commande
iconv.exe -f CP1251 -t UTF-8 test.txt >testout2.txt
convertit le fichier sourcetest.txt
dans le fichier cibletestout2.txt
(Hex:) qui est l'UTF-8 du code de
Записки экспедитора
qui est ce que votre utilisateur s'attendre à voirOriginalL'auteur xmojmr
Vous nie d'utiliser celui-ci:
la chaîne OP fourni est en cp1251, pas cp1252, je pense qu'il ont fait une erreur dans cette partie
OriginalL'auteur mega.venik
Ma solution:
OriginalL'auteur Java Dude
si vous utilisez linux, vous devez utiliser enconv
OriginalL'auteur thiagoh
OriginalL'auteur ssyyzz
essayer le contraire
OriginalL'auteur Don Angelo Annoni