Python: le Sélénium avec PhantomJS vide source de la page

J'ai de la difficulté avec le Sélénium et le PhantomJS sur Windows7 quand je veux obtenir le code source de la page de l'URL.
browser.page_source renvoie uniquement <html><head></head></html>. J'ai mis un sommeil avant browser.page_source mais il n'a pas aidé.

C'est mon code:

from selenium import webdriver
browser = webdriver.PhantomJS('phantomjs-1.9.7-windows\phantomjs.exe')
url = 'myurl'
browser.get(url)
print browser.page_source

Sur Linux avec la même version de PhantomJS, il fonctionne parfaitement. Aussi il fonctionne sur Windows Server 2003.

  • Essayez un peu de débogage, une capture d'écran par exemple
  • La capture d'écran est vide, vide de l'image. Je pensais que c'est un problème avec PhantomJS et j'ai essayé de charger la page avec PyQt4 de webkit, mais le résultat est le même, juste <html> et <head> balises. C'est l'URL qui me donne ce mal de tête: homesearch.com/browse?fulltextquery=miami+fl&page=0
  • J'ai rencontré le même problème lors de la navigation de certains https://url. Utilisation time.sleep(few_seconds) ou webdriver du conditions prévues attendre un certain élément pour être présent sur la page après l'appel de browser.get(url)
  • aussi essayer de créer une instance de pilote avec ces params browser = webdriver.PhantomJS('phantomjs-1.9.7-windows\phantomjs.exe', service_args=['--ignore-ssl-errors=true'])
  • J'ai utilisé un sommeil de 15 à 20 secondes et le résultat était le même. Je vais essayer avec service_args.
InformationsquelleAutor Paul R. | 2014-05-10