Convertir GB2312 de l'UTF-8
J'ai un fichier texte qui contient localisée des chaînes de langue qui est actuellement codé en GB2312 (Chinois simplifié), mais tous mes autres fichiers de langue sont en UTF-8. Je trouve qu'il est très difficile de travailler avec ce fichier, comme aucun de mes éditeurs de texte fonctionne correctement avec et de continuer à corrompre. Existe-il des outils pour convertir ce en UTF-8, et existe-il des inconvénients à le faire? Ne serait-il pas mieux de le garder comme GB2312 et utiliser un autre éditeur (si oui, pouvez-vous recommander un)?
Mise à jour: je suis sous Windows XP (installation en anglais).
Mise à jour #2: j'ai essayé d'utiliser Notepad++ et Notepad2 pour modifier le GB2312 fichiers, mais les deux sont incapables de lire les fichiers et de les corrompre.
Désolé, c'est en Windows XP (installation en anglais).
Vous pourriez essayer d'écrire un rapide/petit utilitaire java qui lit le fichier en une Chaîne de caractères comme GB2312, puis de l'écrit comme de l'UTF-8. Cela devrait fonctionner.
OriginalL'auteur Jon Tackabury | 2008-12-18
Vous devez vous connecter pour publier un commentaire.
Vous pouvez essayer ce service en ligne qui utilise l'Open Source
iconv
utilitaire.Vous pouvez également installer Charco, une version de ligne de commande sur votre machine.
Pour
GB2312
, vous pouvez utiliserCP936
comme l'encodage.Si vous êtes un .Net developer, vous pouvez faire un petit outil qui ne fait que cela.
J'ai lutté avec cette ainsi et a constaté que c'était en fait simple à résoudre à partir d'un programmatiques point de vue.
Tous vous avez besoin est quelque chose comme ça (je l'ai testé et il fonctionne):
En C#
Dans VB.Net
OriginalL'auteur Renaud Bompuis
J'ai peut-être un peu trop simple ici, mais si c'est juste un fichier texte brut, vous pouvez essayer ce qui suit:
&
par&
, tous les<
par<
et tous les>
par>
(pour être sur le côté sûr)Ajouter le suivant dans le fichier texte:
<html><head><meta http-equiv="Content-Type" content="text/html; charset=gb2312" /></head><body><pre>
Ouvrir le fichier dans votre navigateur préféré
Vous auriez fait avec cette avant de vous pourrait ont écrit le code pour faire la conversion ou téléchargé les programmes de faire la conversion pour vous.
Bien sûr, je ne suis pas à cent pour cent sûr que cela va marcher, et que votre navigateur a besoin de la corriger polices et tout et tout, mais vu que vous travaillez avec ces types de fichiers, je suis en supposant que vous avez déjà.
OriginalL'auteur mercator
GB 2312 est surtout compatible avec GB 18030, de sorte que n'importe quel outil capable de traiter avec celui-ci devrait traiter GB 2312 correctement ainsi. Il existe de nombreux outils pour la conversion GB 18030 de l'UTF-8 (ou tout autre codage Unicode forme), mais je ne peux pas le recommander à toute spécifique pour Windows, parce que je travaille sur Unix. Si vous êtes désireux d'écrire un peu de code, la fonction iconv bibliothèque, ou ICU, vient à l'esprit: vous trouverez toutes les données de conversion facilement disponibles dans ces bibliothèques.
Conversion de GB 2312 de l'UTF-8 est complètement sûr et sans perte, vous ne devriez pas vous inquiéter à ce sujet.
OriginalL'auteur Arthur Reutenauer