我使用reddit作爲學習scrappy的基礎。它工作得很好,但現在它總是返回301重定向,即使只是用「scrapy shell www.reddit.com」調用shell。任何想法如何解決這一問題?Scrapy返回301 for reddit.com
-1
A
回答
0
使用HTTPS/HTTP方案中的URL
scrapy shell https://www.reddit.com
0
我覺得它的東西,因爲它似乎阻止您的IP或用戶代理到reddit本身有關,你需要嘗試調整如下: 1-加薪在scrapy設置DOWNLOAD_DELAY 2 - 試圖改變你的用戶代理 與scrapy
3-使用代理欲瞭解更多信息的設置:http://doc.scrapy.org/en/latest/topics/settings.html
對於scrapy代理: http://doc.scrapy.org/en/latest/topics/downloader-middleware.html
相關問題
- 1. 返回基礎:Scrapy
- 2. Django返回HTTP 301?
- 3. 返回ActionResult as 301
- 4. Scrapy返回 「爬0頁」
- 5. Scrapy返回多個項目
- 6. scrapy返回空json文件
- 7. scrapy返回第一項
- 8. For循環在Scrapy中多次返回完整響應
- 9. Facebook網址返回在scrapy
- 10. Scrapy保持返回空值
- 11. Scrapy沒有返回結果
- 12. scrapy mysql返回空結果
- 13. Python scrapy xpath返回數組
- 14. Scrapy沒有返回數據
- 15. Scrapy返回零結果
- 16. Scrapy for dynamic contect
- 17. 爲什麼Nginx繼續返回301?
- 18. Scrapy從管道獲取返回值
- 19. Scrapy返回相同的信息80+次
- 20. 僅在scrapy中返回特定網址
- 21. Scrapy:蜘蛛沒有任何返回
- 22. for循環返回
- 23. 返回410 for robots.txt
- 24. Scrapy只返回第一個結果
- 25. Scrapy response.xpath不返回任何查詢
- 26. Scrapy Spider不返回任何信息
- 27. 後Scrapy返回的結果來分析
- 28. Scrapy - 301在shell中重定向
- 29. Apache2 AWS服務器返回301
- 30. Django測試總是返回301
很確定沒有前面的http或https時會出錯 –