HTML Agility Pack récupère tous les attributs href des ancres à la page
Je suis en train d'ajouter des liens extraites à partir d'un fichier HTML à un CheckBoxList
(cbl_items
).
Il fonctionne jusqu'à présent, mais au lieu de le lien, le nom de l'élément est affiché comme HtmlAgilityPack.HtmlNode.
J'ai essayé d'utiliser DocumentElement
au lieu de Node
mais il a dit qu'il n'existe pas ou similaire.
Comment puis-je obtenir la URL pour être affiché à la place de HtmlAgilityPack.HtmlNode?
C'est ce que j'ai essayé jusqu'à présent:
HtmlWeb hw = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc = hw.Load(tb_url.Text);
foreach (HtmlNode link in doc.DocumentNode.SelectNodes("//a[@href]"))
{
cbl_items.Items.Add(link);
}
source d'informationauteur user3802921
Vous devez vous connecter pour publier un commentaire.
Vous ajoutez le
HtmlNode
objet à laCheckBoxList
et pas de la valeur de lahref
attribut. Ce que vous voyez est leHtmlNode
'sToString()
de valeur, car c'est le meilleur que l'CheckBoxList
pouvez faire pour afficher l'objet.Au lieu de cela, vous pouvez utiliser
GetAttributeValue(string attribute, string defaultValue)
pour récupérer lehref
valeur de l'attribut.