Comment donner l'URL de scrapy pour l'analyse?

Je veux utiliser scrapy pour l'analyse des pages web. Est-il un moyen de passer l'URL de démarrage du terminal lui-même?

Il est donné dans le la documentation que soit le nom de l'araignée ou l'URL peut être donné, mais quand j'ai donné l'url, il renvoie une erreur:

//nom de mon spider est un exemple, mais je donne l'url à la place de mon spider nom(Il fonctionne très bien si je donne spider nom).

scrapy d'analyse example.com

ERREUR:

Fichier
"/usr/local/lib/python2.7/dist-packages/Scrapy-0.14.1-py2.7.egg/scrapy/spidermanager.py",
la ligne 43, de créer
soulever KeyError("Spider introuvable: %s" % spider_name) KeyError: 'Araignée non trouvé: example.com'

Comment puis-je faire scrapy à utiliser mon araignée sur l'url donnée dans le terminal??

  • Est example.com ajouté à la allowed_domains de votre araignée?
  • oui example.com est ajouté à allowed_domains. Ce que je veux vraiment, c'est donner start_url en ligne de commande. comment puis-je le faire?
InformationsquelleAutor G Gill | 2012-03-13