à © et d'autres codes
J'ai obtenu un fichier plein de ces codes, et je tiens à "traduire" en normal caractères (un fichier entier, je veux dire). Comment puis-je le faire?
Je vous remercie beaucoup à l'avance.
Que voulez-vous dire exactement? Que voyez-vous lorsque vous ouvrez le fichier dans un éditeur hexadécimal?
Désolé pour ma mauvaise explication. Je veux dire, avec utf8_decode() de PHP, je peux montrer la valeur réelle, mais j'ai besoin de changement pour l'ensemble du fichier. Comment faire?
Désolé pour ma mauvaise explication. Je veux dire, avec utf8_decode() de PHP, je peux montrer la valeur réelle, mais j'ai besoin de changement pour l'ensemble du fichier. Comment faire?
OriginalL'auteur Matts | 2010-11-14
Vous devez vous connecter pour publier un commentaire.
Semble que vous avait à l'origine un fichier UTF-8 qui a été interprété comme un 8 bits de codage (par exemple,ISO-8859-15) et de l'entité encodée. Je dis cela parce que la séquence C3A9 ressemble à un assez plausible L'encodage UTF-8 de la séquence.
Vous aurez besoin à la première entité-décoder, puis vous aurez un encodage UTF-8 de nouveau. Vous pouvez utiliser quelque chose comme iconv à convertir l'encodage de votre choix.
De travailler à travers votre exemple:
Vous mentionnez vouloir gérer cela avec PHP, quelque chose comme cela pourrait le faire pour vous:
Mais comment faire pour modifier un fichier entier? Je veux dire, c'est un fichier avec "commun" du texte et des séquences codées...
Si cette technique ne fonctionne pas pour votre dossier, je vous suggère, y compris un petit dump d'un échantillon pertinent de votre fichier.
Par exemple: Précédent (c'est un mot français). Dans le fichier, il existe des mots sans accents, mais d'autres (et c'est la question, j'ai besoin de convertir les accents de mots, au moins, UTF8, et puis je serais probablement utiliser iconv ou quelque chose du genre).
Le résultat de html_entity_decode() sur la chaîne que vous avez fourni est l'encodage UTF-8 de Précédent - pas sûr que je vois le problème.
OriginalL'auteur Paul Dixon