Je suis en utilisant HtmlAgilityPack. Est-il une ligne de code que je peux obtenir tout intérieure du texte de html, par exemple, de supprimer toutes les balises html et des scripts?
Noter que ce sera le retour de la teneur du texte de <script> balises.
Pour corriger cela, vous pouvez supprimer tous les <script> balises, comme ceci:
foreach(var script in doc.DocumentNode.Descendants("script").ToArray())
script.Remove();foreach(var style in doc.DocumentNode.Descendants("style").ToArray())
style.Remove();
Il semble que DocumentNode n'a pas une fonction nommée Descendant? "'HtmlAgilityPack.HtmlNode' ne contient pas une définition pour 'Descendants'" Quelle version utilisez-vous? HTML Agility Pack V1.3.0.0, est-il trop vieux? Oui; obtenir une version plus récente. J'ai utilisé ce code pour résoudre un problème de la mine. J'ai une question cependant. Comment peut-enlèvement être effectué dans une boucle foreach ?
J'ai écrit une méthode simple. Il peut vous aider. Cette méthode permet d'extraire tous les balise spécifique du nœud. Ensuite, vous pouvez utiliser le HtmlNodeCollection[i].InnerText pour obtenir son texte.
Comme ceci:
Noter que ce sera le retour de la teneur du texte de
<script>
balises.Pour corriger cela, vous pouvez supprimer tous les
<script>
balises, comme ceci:Quelle version utilisez-vous?
HTML Agility Pack V1.3.0.0, est-il trop vieux?
Oui; obtenir une version plus récente.
J'ai utilisé ce code pour résoudre un problème de la mine. J'ai une question cependant. Comment peut-enlèvement être effectué dans une boucle foreach ?
OriginalL'auteur SLaks
J'ai écrit une méthode simple. Il peut vous aider. Cette méthode permet d'extraire tous les balise spécifique du nœud. Ensuite, vous pouvez utiliser le
HtmlNodeCollection[i].InnerText
pour obtenir son texte.OriginalL'auteur tsingroo