Beautifulsoup obtenir span contenu
J'ai analysé page html: utilisation de beautifulsoup
user_page = urllib2.urlopen(user_url)
souping_page = bs(user_page)
badges = souping_page.body.find('div', attrs={'class': 'badges'})
après mon badges
objet ressemble à ceci:
<span><span title="9 gold badges"><span class="badge1"></span><span class="badgecount">9</span></span><span title="38 silver badges"><span class="badge2"></span><span class="badgecount">38</span></span><span title="56 bronze badges"><span class="badge3"></span><span class="badgecount">56</span></span></span>
Maintenant je veux extraire exemple 9 gold badges
, 38 silver badges
à partir de cela, j'ai essayé d'utiliser badges.span.span
mais qui ne fonctionne pas.
OriginalL'auteur add-semi-colons | 2014-03-07
Vous devez vous connecter pour publier un commentaire.
Obtenir le parent
span
debadges
, trouvez tous les haut-niveau s'étend à l'intérieur en utilisantfind_all()
avecrecursive=False
:imprime:
Espère que ça aide.
OriginalL'auteur alecxe