Pourquoi cette url élever BadStatusLine avec httplib2 et urllib2?
À l'aide de httplib2 et urllib2, je suis en train de télécharger les pages à partir de cette url, mais tous n'ont pas fonctionné et il a terminé avec cette exception.
content = conn.request(uri="http://www.zdnet.co.kr/news/news_print.asp?artice_id=20110727092902")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/lib/python2.7/dist-packages/httplib2/__init__.py", line 1129, in request
(response, content) = self._request(conn, authority, uri, request_uri, method, body, headers, redirections, cachekey)
File "/usr/lib/python2.7/dist-packages/httplib2/__init__.py", line 901, in _request
(response, content) = self._conn_request(conn, request_uri, method, body, headers)
File "/usr/lib/python2.7/dist-packages/httplib2/__init__.py", line 871, in _conn_request
response = conn.getresponse()
File "/usr/lib/python2.7/httplib.py", line 1027, in getresponse
response.begin()
File "/usr/lib/python2.7/httplib.py", line 407, in begin
version, status, reason = self._read_status()
File "/usr/lib/python2.7/httplib.py", line 371, in _read_status
raise BadStatusLine(line)
En-tête HTTP est comme ça
http://www.zdnet.co.kr/news/news_print.asp?artice_id=20110727092902
GET /news/news_print.asp?artice_id=20110727092902 HTTP/1.1
Host: www.zdnet.co.kr
User-Agent: Mozilla/5.0 (Windows NT 5.1; rv:10.0.1) Gecko/20100101 Firefox/10.0.1
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: ko-kr,ko;q=0.8,en-us;q=0.5,en;q=0.3
Accept-Encoding: gzip, deflate
Connection: keep-alive
Cookie: RMID=7d83495d4f336fe0; __utma=37206251.1552605885.1328771258.1328771258.1329070845.2; __utmz=37206251.1328771258.1.1.utmcsr=(direct)|utmccn=(direct)|utmcmd=(none); ASPSESSIONIDCSQCQTDD=BCLEHPPDEPHEBJDLCFNDMKDN; __utmc=37206251; ASPSESSIONIDSSQCQQCB=MJPLMOJAFPDFCLONCANBIKHN; _EXEN=2
X-FireLogger: 1.2
HTTP/1.1 200 OK
Date: Mon, 13 Feb 2012 18:02:56 GMT
Content-Length: 19158
Content-Type: text/html;charset=UTF-8; Charset=UTF-8
Set-Cookie: ASPSESSIONIDSQSDQRDB=NGAIFHKAGDIOGEMANAOLLKKF; path=/
Cache-Control: private
La moindre idée?
Merci de poster votre déclaration de connexion.
OriginalL'auteur goodhyun | 2012-02-13
Vous devez vous connecter pour publier un commentaire.
Cela fonctionne très bien pour moi:
Le site supprime toutes les demandes qui se produisent sans
User-Agent
chaîne.OriginalL'auteur Blender
Pour toutes les personnes qui se retrouvent ici avec un problème similaire après l'installation de httplib2 0.8:
Version 0.8 a une régression avec gestion des connexions en relation avec HTTP keep-alive. Voir le rapport de bug: https://code.google.com/p/httplib2/issues/detail?id=250
Il y a un correctif pour ce problème, mais il n'a pas été publié jusqu'à présent. Jusqu'alors seulement utiliser httplib2 0.7.7.
OriginalL'auteur smlz
Dans mon code,quand j'utilise
l'exception apparaît. Cependant, lorsque j'utilise
tout est ok.
Peut-être cela aidera u.
OriginalL'auteur Chelsea Wang
Ressembler à cette page web ne permettez pas à votre agent utilisateur. Vous pouvez le modifier comme ceci:
OriginalL'auteur tito