Comment puis-je convertir une chaîne de caractères UTF-8 dans Android?
Je suis à l'aide d'un analyseur HTML appelé Jsoup, pour charger et d'analyser des fichiers HTML. Le problème est que la page web que je suis en raclant est codée dans ISO-8859-1
charset alors que Android est à l'aide de UTF-8
encodage(?). C'est les résultats dans certains caractères qui se manifeste comme des points d'interrogation.
Alors maintenant, je suppose que je doit convertir la chaîne de caractères au format UTF-8.
Maintenant, j'ai trouvé cette Classe appelée CharsetEncoder dans le SDK Android, qui je pense pourrait m'aider. Mais je ne peux pas comprendre comment le mettre en œuvre dans la pratique, donc je me demande si pourrait obtenir som aider par un exemple pratique.
Mise à JOUR: le Code pour lire les données (Jsoup)
url = new URL("http://www.example.com");
Document doc = Jsoup.parse(url, 4000);
OK, j'ai mis à jour mon post.
OriginalL'auteur droidgren | 2010-07-01
Vous devez vous connecter pour publier un commentaire.
Vous pouvez laisser Android faire le travail pour vous à la lecture de la page dans un byte[] et puis, à l'aide de la jSoup méthodes pour l'analyse des objets String.
N'oubliez pas de spécifier l'encodage lorsque vous créez la chaîne à partir de la lecture de données à partir du serveur à l'aide de la Chaîne correcte constructeur.
OriginalL'auteur Al Sutton
Octet codages et les Chaînes de caractères
OriginalL'auteur droidgren