Schéma manquant dans l'URL de demande

Je suis coincé sur ce bug pendant un certain temps, le message d'erreur suivant se présente comme suit:

File "C:\Python27\lib\site-packages\scrapy-0.20.2-py2.7.egg\scrapy\http\request\__init__.py", line 61, in _set_url
            raise ValueError('Missing scheme in request url: %s' % self._url)
            exceptions.ValueError: Missing scheme in request url: h

Scrapy code:

    from scrapy.contrib.spiders import CrawlSpider, Rule
    from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor
    from scrapy.selector import Selector
    from scrapy.http import Request
    from spyder.items import SypderItem

    import sys
    import MySQLdb
    import hashlib
    from scrapy import signals
    from scrapy.xlib.pydispatch import dispatcher

    # _*_ coding: utf-8 _*_

    class some_Spyder(CrawlSpider):
        name = "spyder"

        def __init__(self, *a, **kw):
            # catch the spider stopping
            # dispatcher.connect(self.spider_closed, signals.spider_closed)
            # dispatcher.connect(self.on_engine_stopped, signals.engine_stopped)

            self.allowed_domains = "domainname.com"
            self.start_urls = "http://www.domainname.com/"
            self.xpaths = '''//td[@class="CatBg" and @width="25%" 
                          and @valign="top" and @align="center"]
                          /table[@cellspacing="0"]//tr/td/a/@href'''

            self.rules = (
                Rule(SgmlLinkExtractor(restrict_xpaths=(self.xpaths))),
                Rule(SgmlLinkExtractor(allow=('cart.php?')), callback='parse_items'),
                )

            super(spyder, self).__init__(*a, **kw)

        def parse_items(self, response):
            sel = Selector(response)
            items = []
            listings = sel.xpath('//*[@id="tabContent"]/table/tr')

            item = IgeItem()
            item["header"] = sel.xpath('//td[@valign="center"]/h1/text()')

            items.append(item)
            return items

Je suis sûr que c'est quelque chose à voir avec l'url je me demande scrapy à suivre dans le LinkExtractor. Lors de l'extraction de leur coquille, ils cherchent quelque chose comme ceci:

data=u'cart.php?target=category&category_id=826'

Par rapport à une autre url, extraite d'un travail d'araignée:

data=u'/path/someotherpath/category.php?query=someval'

J'ai eu un coup d'oeil à quelques questions, telles que Téléchargement de photos avec scrapy mais de le lire, je crois que j'ai un problème un peu différent.

J'ai aussi pris un coup d'oeil à ce -
http://static.scrapy.org/coverage-report/scrapy_http_request___init__.html

ce qui explique que l'erreur est levée si l'auto.url manque un ":", en regardant les start_urls j'ai défini je n'arrive pas à voir pourquoi cette erreur serait de montrer puisque le système est clairement défini.

Merci pour la lecture,

Toby

source d'informationauteur Toby