À l'aide de BeautifulSoup pour sélectionner des blocs div dans le code HTML
Je suis en train d'analyser plusieurs div blocs à l'aide de Belle Soupe à l'aide du code html à partir d'un site web. Cependant, je ne peut pas travailler de la fonction qui doit être utilisé pour sélectionner ces blocs div. J'ai essayé ce qui suit:
import urllib2
from bs4 import BeautifulSoup
def getData():
html = urllib2.urlopen("http://www.racingpost.com/horses2/results/home.sd?r_date=2013-09-22", timeout=10).read().decode('UTF-8')
soup = BeautifulSoup(html)
print(soup.title)
print(soup.find_all('<div class="crBlock ">'))
getData()
Je veux être en mesure de sélectionner tout ce qui est entre <div class="crBlock ">
et sa bonne fin </div>
. (Évidemment, il existe d'autres balises div, mais je veux choisir le bloc tout en bas à celui qui représente la fin de cette section de code html.)
OriginalL'auteur SMNALLY | 2013-09-25
Vous devez vous connecter pour publier un commentaire.
L'utilisation correcte serait:
Par défaut, belle soupe sera le retour de la balise entière, y compris le contenu. Ensuite, vous pouvez faire ce que vous voulez si vous le stocker dans une variable. Si vous êtes seulement à la recherche d'un div, vous pouvez également utiliser
find()
à la place. Par exemple:Découvrez la page de documentation pour plus d'info sur tous les filtres que vous pouvez utiliser.
OriginalL'auteur Wiwiweb