scrapy comment définir referer url
Ce que je dois mettre l'url referer, avant de racler un site, le site utilise précisant l'url de base de l'Authentification, de sorte qu'il ne me permet pas de vous identifier si le referer n'est pas valide.
Quelqu'un pourrait-il dire à la façon de faire dans Scrapy?
OriginalL'auteur vumaasha | 2012-10-25
Vous devez vous connecter pour publier un commentaire.
Si vous souhaitez modifier le referer dans votre araignée demande, vous pouvez modifier DEFAULT_REQUEST_HEADERS dans le settings.py fichier
Exemple:
DEFAULT_REQUEST_HEADERS = {
'Referer': 'http://www.google.com'
}
OriginalL'auteur Cristóbal Morales
Vous devez faire exactement ce que @warwaruk indiqué, ci-dessous mon exemple d'élaboration pour une analyse de l'araignée:
Ce qui devrait générer à la suite de journaux dans votre terminal:
Fonctionnera même avec BaseSpider. En fin de compte start_requests méthode est BaseSpider méthode, à partir de laquelle CrawlSpider hérite.
La Documentation explique plus d'options pour être mis dans la Demande en dehors des en-têtes, tels que: les cookies , en fonction de rappel, la priorité de la demande, etc
OriginalL'auteur Kulbi
Remplacer
BaseSpider.start_requests
et y créer votre custom Demande passant votrereferer
en-tête.OriginalL'auteur warvariuc
Juste mis en Referer url dans les en-têtes de Requête
Exemple:
return Request(url=your_url,
headers={'Referer':'http://your_referer_url'})
OriginalL'auteur hahakubile