Comment puis-je extraire du texte à partir de l'html

J'ai une exigence pour extraire tout le texte qui est présent dans le <body> de l'html. Exemple de code Html d'entrée :-

<html>
    <title>title</title>
    <body>
           <h1> This is a big title.</h1>
           How are doing you?
           <h3> I am fine </h3>
           <img src="abc.jpg"/>
    </body>
</html>

La sortie doit être :-

This is a big title. How are doing you? I am fine

Je veux utiliser uniquement HtmlAgility à cette fin. Aucune des expressions régulières s'il vous plaît.

Je sais comment charger HtmlDocument, puis à l'aide de xquery comme "//corps", on peut obtenir le contenu du corps. Mais comment puis-je bande le html comme je l'ai montré dans la production?

Merci d'avance 🙂

  • Voir cette question pour le code HTML Agility Pack liens. Je suppose que vous avez d'appeler quelque chose comme InnerText bien sur la HtmlNode.
InformationsquelleAutor TCM | 2011-05-01