non valide octet 2 de 2 octets UTF-8 séquence
Je suis en train d'essayer de parser un fichier XML avec <?version = 1.0, encoding = UTF-8>
mais a couru dans un message d'erreur invalid byte 2 of 2-byte UTF-8 sequence
. Quelqu'un sait quelle est la cause de ce problème?
- comment êtes-vous de l'analyse du fichier xml?
Vous devez vous connecter pour publier un commentaire.
Plus souvent c'est dû à l'alimentation
ISO-8859-x
(Latin-x, comme le Latin-1), mais analyseur en pensant que c'est arriverUTF-8
. Certaines séquences de caractères Latin-1 (deux fois de suite les caractères avec accents et les trémas) formulaire de quelque chose qui n'est pas valide commeUTF-8
, et en particulier celles qui sur la base des premier octet, deuxième octet est inattendu de bits d'ordre élevé.Cela peut facilement se produire lorsque certains processus se déverse
XML
en Latin-1, mais oublie de sortieXML
déclaration (dans ce cas,XML
analyseur doit par défaut pourUTF-8
, comme parXML
les specs), ou prétend que c'estUTF-8
même quand il ne l'est pas.Soit l'analyseur est configuré pour l'UTF-8 même si le fichier est codé autrement, ou que le fichier est déclaré que l'utilisation de l'UTF-8, mais il n'a pas vraiment d'.
J'ai eu le même problème. Mon problème est que j'ai créé un nouveau fichier XML avec jdom et la FileWriter(xmlFile). Le FileWriter n'a pas été en mesure de créer un Fichier UTF-8.
Au lieu d'utiliser la FileOutputStream(xmlFile) résolu.
Vous pouvez essayer de modifier la valeur par défaut l'encodage de caractères utilisé par la Chaîne de caractères.getBytes() pour de l'utf-8. Utiliser VM option -Dfile.encoding=utf-8.
Pour ceux qui ont encore obtenir une telle erreur.
depuis UTF-8 est utilisé découvrez votre document xml pour toute les lettres latines ou alors:
J'ai eu le même problème et la raison était que j'avais ceci:
Espère que cette aide
J'ai eu le même problème lorsque vous essayez d'importer mon .fichier xml dans mon java outil. Et j'ai trouvé une bonne solution pour cela:
1. Ouvert le .fichier xml avec Notepad++ puis enregistrez le .fichier xml .fichier rtf. Ouvrez ensuite ce fichier dans WordPad application.
2. Enregistrer la .fichier rtf que .txt fichier, puis l'ouvrir avec le bloc-notes et enregistrer en tant que .fichier xml de nouveau. Lors de l'enregistrement dans le bloc-notes, près de la fin de la fenêtre pop-up, assurez-vous de choisir l'option "Encoding: UTF-8".
Il a travaillé pour le mien, j'espère que c'est utile pour le vôtre aussi.