我收到了來自服務器的302響應而報廢網站302重定向:如何處理scrapy
2014-04-01 21:31:51+0200 [ahrefs-h] DEBUG: Redirecting (302) to <GET http://www.domain.com/Site_Abuse/DeadEnd.htm> from <GET http://domain.com/wps/showmodel.asp?Type=15&make=damc&a=664&b=51&c=0>
我要發送請求來獲取網址,而不是重定向。現在我發現這個中間件:
https://github.com/scrapy/scrapy/blob/master/scrapy/contrib/downloadermiddleware/redirect.py#L31
我加入這個重定向代碼到我的middleware.py文件,我加入到這個settings.py:
DOWNLOADER_MIDDLEWARES = {
'street.middlewares.RandomUserAgentMiddleware': 400,
'street.middlewares.RedirectMiddleware': 100,
'scrapy.contrib.downloadermiddleware.useragent.UserAgentMiddleware': None,
}
但我還是被重定向。這就是爲了讓這個中間件工作而必須做的一切嗎?我想念什麼?
他們可能無休止地將您重定向到您的網站。至少,這就是網址讓我相信的地方。 – elbear
是的,這顯然是他們參加,我之所以發佈這個問題。它不是一個無限循環,它簡單的302重定向,原始url仍然以GET方式接收:從那就是我想要發送我的請求的URL。據我所知,這是可能的,我發現了一個腳本,但由於某種原因,我的設置不起作用。 –
mrki
我並不是說它是一個無限循環。我的意思是說,每當你提出請求時,你都會被重定向,所以他們拒絕給你內容。 – elbear