belle soupe à l'obtention de la balise.id
Je suis d'essayer d'obtenir une liste de div id d'une page. Quand j'imprime les attributs, j'ai l'id répertoriés.
for tag in soup.find_all(class_="bookmark blurb group") :
print(tag.attrs)
résultats dans:
{'id': 'bookmark_8199633', 'role': 'article', 'class': ['bookmark', 'blurb', 'group']}
{'id': 'bookmark_7744613', 'role': 'article', 'class': ['bookmark', 'blurb', 'group']}
{'id': 'bookmark_7338591', 'role': 'article', 'class': ['bookmark', 'blurb', 'group']}
{'id': 'bookmark_7338535', 'role': 'article', 'class': ['bookmark', 'blurb', 'group']}
{'id': 'bookmark_4530078', 'role': 'article', 'class': ['bookmark', 'blurb', 'group']}
Donc je sais qu'il y a de l'ids. Cependant, quand j'imprime l'étiquette.id au lieu de cela, je viens d'obtenir une liste de "None". Ce que je fais mal?
OriginalL'auteur klreeher | 2014-07-25
Vous devez vous connecter pour publier un commentaire.
Vous pouvez accéder à des attributs de balise par le traitement de l'étiquette comme un dictionnaire (la documentation):
La raison
tag.id
ne fonctionne pas, c'est que c'est équivalent àtag.find('id')
, ce qui se traduit parNone
puisqu'il n'est pasid
balise trouvée (la documentation).OriginalL'auteur alecxe