Le décodage de toutes les Entités HTML
Je suis à la recherche d'une fonction qui va décoder une bonne quantité d'entités HTML.
Raison est que je suis en train de travailler sur certains code HTML du contenu et de la transformer en texte brut, le problème que j'ai, c'est beaucoup d'entités ne pas convertis à l'aide de HttpUtility.HtmlDecode
.
Quelques exemples d'entités que je suis préoccupé sont , &, ©.
C'est pour .net 3.5.
- Je suis passé à .Net 3.5 et utilisé
Console.WriteLine(HttpUtility.HtmlDecode(" , &, ©"));
et il a bien fonctionné pour moi. Je ne vois pas pourquoi vous auriez de la difficulté. Vous avez une drôle de codage de la chaîne ou quelque chose?
Vous devez vous connecter pour publier un commentaire.
Alors peut-être que vous aurez besoin de la HttpUtility.HtmlDecode?.
Il doit fonctionner, vous devez ajouter une référence à System.Web.
Au moins, c'est la manière .Net Framework < 4.
Par exemple le code suivant:
Travaillé et le résultat a été comme prévu (esperluette et le symbole du droit d'auteur).
Êtes-vous sûr que le problème est dans HtmlDecode et pas autre chose?
Mise à JOUR: une Autre classe capable de faire le travail, WebUtility (nouveau HtmlDecode méthode) est entré dans les versions plus récentes de .Net. Toutefois, il semble y avoir quelques problèmes avec lui. Voir la HttpUtility vs WebUtility question.
Utilisation
WebUtility.HtmlDecode
inclus dans .Net 4Par exemple, si je exécuter dans une application console:
- Je obtenir
, &, c
HtmlDecode
méthode?