Obtenir le contenu de la div d'id avec BeautifulSoup
Je suis à l'aide de python2.7.6, urllib2, et BeautifulSoup
pour extraire le code html d'un site web et de les stocker dans une variable.
Comment puis-je montrer le contenu html d'un div
avec un id en utilisant beautifulsoup?
<div id='theDiv'>
<p>div content</p>
<p>div stuff</p>
<p>div thing</p>
serait
<p>div content</p>
<p>div stuff</p>
<p>div thing</p>
Vous devez vous connecter pour publier un commentaire.
Rejoindre les éléments de la balise div est
.contenu
:Imprime:
print ''.join(map(str, div.contents))
contents
contient en fait tous les de la de la balise enfants qui peut être représenté comme une chaîne de caractères, ou comme unTag
instance de classe. L'application demap(str, ...)
permet de jeter chaque enfant à la chaîne. Espérons que cela aide.UnicodeEncodeError: 'ascii' codec can't encode character u'\u20ac' in position 31: ordinal not in range(128)