Python BeautifulSoup gratter tables
Je suis en train de créer une table de gratter avec BeautifulSoup. J'ai écrit ce code Python:
import urllib2
from bs4 import BeautifulSoup
url = "http://dofollow.netsons.org/table1.htm" # change to whatever your url is
page = urllib2.urlopen(url).read()
soup = BeautifulSoup(page)
for i in soup.find_all('form'):
print i.attrs['class']
J'ai besoin de gratter Nome, Cognome, e-Mail.
OriginalL'auteur kingcope | 2013-09-23
Vous devez vous connecter pour publier un commentaire.
De la boucle sur les lignes de la table (
tr
tag) et le texte des cellules (td
tag) à l'intérieur:imprime:
Pour info,
[2:]
tranche ici est de sauter deux lignes d'en-tête.UPD, voici comment vous pouvez enregistrer les résultats dans un fichier txt:
bien sûr, c'est là, dans la réponse à sauter les 2 lignes d'en-tête.
OriginalL'auteur alecxe