analyse site possède une infinité de défilement à l'aide de python
J'ai fait des recherches et pour l'instant j'ai trouvé le paquet python que je vous prévoyez sur l'utilisation de ses scrapy, maintenant j'essaie de trouver ce qui est une bonne façon de construire un racloir à l'aide de scrapy pour analyser le site avec un nombre infini de défilement. Après avoir creusé autour, j'ai trouvé qu'il y a un paquet d'appel de sélénium et il a module python. J'ai le sentiment que quelqu'un l'a déjà fait à l'aide de Scrapy et Le sélénium pour gratter le site avec un nombre infini de défilement. Ce serait génial si quelqu'un peut pointer vers un exemple.
Une façon de le faire est de déclencher certaines touches fléchées de votre clavier pour faire de votre navigateur, faites défiler vers le bas.
Prendre un coup d'oeil: stackoverflow.com/questions/17975471/...
Prendre un coup d'oeil: stackoverflow.com/questions/17975471/...
OriginalL'auteur add-semi-colons | 2014-03-28
Vous devez vous connecter pour publier un commentaire.
Cela va ouvrir une page, trouver le plus bas de l'élément avec le
id
et le défilement de l'élément dans la vue. Vous devrez garder de l'interrogation du pilote pour obtenir le dernier élément que la page se charge plus, et j'ai trouvé que c'était assez lent comme les pages d'obtenir une grande. Le temps est dominé par l'appel àdriver.find_element_*
parce que je ne sais pas d'une manière explicitement interroger le dernier élément dans la page.Par l'expérimentation que vous pourriez trouver qu'il y a une limite supérieure à la somme des éléments de la page se charge dynamiquement, et il serait mieux si vous avez écrit quelque chose que chargé de ce nombre, et seulement alors, fait un appel à
driver.find_element_*
.OriginalL'auteur maxywb
Vous pouvez utiliser le sélénium à la ferraille de l'infini défilement site web comme twitter ou facebook.
Étape 1 : Installez le Sélénium aide de pip
Étape 2 : utilisez le code ci-dessous pour automatiser infini défilement et d'extraire le code source
La boucle for permet d'analyser à travers l'infini des parchemins et des post que vous pouvez extraire les données chargées.
Etape 3 : Imprimez les données si nécessaire.
OriginalL'auteur Pawan Kumar