Caractère problème de codage de caractères français
Dans l'application web,il y a une page HTML avec ci-dessous d'encodage:
<meta content="text/html; charset=UTF-8" http-equiv="Content-Type">
<meta content="en" http-equiv="Content-language">
<meta content="text/html; charset=UTF-8" http-equiv="Content-type">
Ce qui se passe en réalité, c'est sur cette page que je suis en train d'afficher un résultat d'une requête soap. En réponse de ce savon-demande, je reçois des codes suivants:
èéàùìçò
pour les caractères suivants:
èéàùìçò
et étonnamment sur la page HTML ces caractères sont correctement affichés ci-dessous en plus de la page est encodé en UTF-8:
èéàùìçò instead of �������
Je ne suis pas en mesure de comprendre la façon dont ces codes peuvent être correctement converti au format UTF-8 comme ces codes appartiennent à ISO-8859-15.Une idée?
- Ces personnages n'appartiennent pas seulement au caractère. Il ya beaucoup de différents jeux de caractères qui contiennent ces caractères.
Vous devez vous connecter pour publier un commentaire.
Le caractère des références telles que
è
ont des significations basé sur Unicode nombre de caractères, tout à fait indépendamment de l'encodage des caractères de la page. Cela a toujours été le principe en HTML, et que très tôt les navigateurs parfois eu ce mal. C'est l'un des principaux avantages de l'utilisation de références de caractère.La première 256 positions de code Unicode sont identiques à la norme ISO-8859-1 du code des postes, qui à son tour sont identiques à la norme ISO-8859-15 positions de code à l'exception de quelques caractères (ne pas les inclure dans votre exemple).