Windows-1252 encodage des caractères incorrects affiche

J'ai un tampon avec les caractères encodés en Windows-1252. Cependant, quand je créer une nouvelle Chaîne avec codage approprié, au lieu de résultat attendu, j'ai assez souvent l'interrogatoire marques, ex.

byte[] tmps = new byte[] {(byte) 0xfb};
System.out.println (new String (tmps,0,1,"Windows-1252" ));

Comme résultat le système doit afficher "u" char avec "^" au-dessus d'elle. Au lieu de cela, il affiche "?".

Une idée?

J'ai lancé ce code dans un test unitaire dans NetBeans 8 à l'aide de Java 8, et il affiche "u" avec l'accent circonflexe l'amende juste.

InformationsquelleAutor user2707175 | 2013-08-24

encoding java

1

Tout d'abord, Windows-1252 est un codage pris en charge:
- Si ce n'était pas, vous obtiendrez un UnsupportedEncodingException dans new String (...,"Windows-1252"). (C'est ce que l' javadoc dit!)
- L'Oracle Java documentation dire Windows-1252 est dans la "Base Encodage" - http://docs.oracle.com/javase/7/docs/technotes/guides/intl/encoding.doc.html, http://docs.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.html, etcetera.
Je pense que le problème le plus probable est ici du côté de la production. Plus précisément, Java peut penser que vos paramètres régionaux par défaut du jeu de caractères ASCII ou quelque chose qui ne supportent pas que codepoint.

Un moyen d'éliminer Windows-1252 comme le cause de ce problème consiste à écrire l'équivalent de chaîne à l'aide d'un échappement Unicode; par exemple,
```
    System.out.println("\u00fb");
```
- Système.out.println("\u00fb"); ne fonctionne pas désolé.
- Après un peu plus d'une enquête, il est clair que le problème est avec l'affichage des caractères dans la console (eclipse) que la chaîne convertie aux valeurs integer char par char donne les valeurs correctes. De plus lorsque le débogage et l'affichage de la valeur de la variable de Chaîne, le "u" " ^ " est affiché correctement. Donc c'est bien le problème avec la console, mais comment le résoudre?
- Et java exécuté directement à partir de la ligne de commande (sans Eclipse) ont le même problème avec l'affichage. 🙁 Étonnamment Windows-1250 caractères sont affichés correctement. J'ai essayé de changer la police utilisée pour la fenêtre cmd mais c'est la même histoire. Comment résoudre ce problème?
- Ce qui aide, c'est "java -Dfile.encoding=cp1252 MyClassNameWithMain" mais ce n'est pas la solution que j'ai besoin d'avoir Unicode complet - deux langues différentes affichés dans la console.
- Si votre console est en UTF-8 capable, vous devez modifier les paramètres pertinents du système pour forcer la console pour utiliser l'UTF-8. Ensuite, réglez le Java par défaut l'encodage UTF-8.
- Vous devriez jeter un oeil à docs.oracle.com/javase/8/docs/technotes/guides/intl/... le nom peut être différent
InformationsquelleAutor Stephen C
1

J'ai déjà trouvé ce.

Menu Run/Run configurations/suivante, Java de l'Application et de votre propre nom de l'application/l'onglet suivant/encodage UTF-8

Et depuis maintenant deux windows 1250 et 1252 caractères semble être affiché ok.

InformationsquelleAutor user2707175

Vous devez vous connecter pour publier un commentaire.