rvest comment sélectionner une css spécifique nœud par id
Je suis en train d'utiliser le rvest paquet de recueillir des données à partir d'une page web. Dans un format simple, le code html ressemble à ceci:
<div class="style">
<input id="a" value="123">
<input id="b">
</div>
Je veux obtenir la valeur de 123 à partir de la première entrée. J'ai essayé les R code:
library(rvest)
url<-"xxx"
output<-html_nodes(url, ".style input")
Cela, vous obtiendrez une liste des balises input:
[[1]]
<input id="a" value="123">
[[2]]
<input id="b">
Ensuite, j'ai essayé d'utiliser html_node pour faire référence à la première balise input id:
html_node(output, "#a")
Ici, il est retourné une liste de valeurs null à la place de la balise d'entrée que je veux.
[[1]]
NULL
[[2]]
NULL
Ma question est, comment puis-je référence de la balise d'entrée à l'aide de son id?
OriginalL'auteur Vegebird | 2015-08-20
Vous devez vous connecter pour publier un commentaire.
Vous pouvez utiliser xpath:
La façon la plus simple pour obtenir les feuilles de style css et xpath-sélecteur est à utiliser http://selectorgadget.com/.
Pour un attribut spécifique, comme la vôtre, l'utilisation de google chrome barre d'outils du développeur pour obtenir le xpath comme suit:
OriginalL'auteur Rentrop
Cela fonctionnera très bien droites avec des sélecteurs CSS:
OriginalL'auteur hrbrmstr