我在抓取每個用戶的數據,我不知道整個時間段內是否會有數據。因此,我想先大量調用API,然後如果有結果,則在該大塊內調用API以獲得較小的時間增量。我最初試圖抓取大塊的數據,但API似乎有一些記錄的最大記錄要顯示,有時只顯示記錄的一部分,導致json格式化問題和不完整的數據。根據之前Request對象的響應對象的長度,編寫一個可以生成新的Request對象的蜘蛛的智能方法是什麼?我沒有嘗試過任何東西,因爲我所能想到的是在蜘蛛的分析方法中創建請求,但這似乎是錯誤的。感謝您提供我在文檔中遺漏的任何建議/指示。根據事先請求的結果做出scrapy請求?
0
A
回答
0
在parse
方法(或任何其他回調方法,parse
只是默認值)內創建請求是完全正常的。 Scrapy的設計使得任何回調都可以返回一個數據項目或請求列表,Scrapy將處理輸出處理每個事物的不同方式(將項目發送到要存儲的管道或任何其他事物,或者安排新的請求 - 可能的不同的配置回調)。
這是更好地在概述頁面即將推出的下一個Scrapy版本的解釋,你可以隨時查看的位置:http://scrapy.readthedocs.org/en/master/intro/overview.html
注意,示例代碼使用尚未發佈的功能(收益類型的字典,response.urljoin
方法),但解釋是有效的。
相關問題
- 1. 獲取Scrapy請求的結果
- 2. 做出請求
- 3. 根據請求限制結果圖
- 4. 減慢取決於先前請求結果的API請求
- 5. 根據請求
- 6. 根據beforeSend事件結果終止jquery ajax請求
- 7. TFS Build根據構建請求者給出不同的結果
- 8. Scrapy延遲請求
- 9. 如何在scrapy中提出請求之前更改請求url?
- 10. Python請求庫預先請求鉤子
- 11. Spring MVC的:根據請求
- 12. scrapy的鏈接請求
- 13. scrapy中的延遲請求
- 14. Python請求 - 根據給定的捲曲請求格式數據
- 15. Scrapy中的持久請求元數據
- 16. POST請求給出空結果
- 17. Php SQL請求給出0結果
- 18. ASIHTTPRequest:優先請求
- 19. 使用scrapy發出POST請求
- 20. scrapy無法發出請求()回調
- 21. Scrapy Selenium無法提出請求()回調
- 22. backbone.js根據ajax請求的結果採取不同的行動
- 23. Scrapy。如何將請求結果返回給調用方法?我可以在scrapy中使用python請求庫嗎?
- 24. 結果SQL請求選擇
- 25. 跟蹤XMLHTTP請求結果
- 26. 返回WinJS.xhr請求結果
- 27. CURL請求下載結果
- 28. Scrapy - 篩選重複請求
- 29. scrapy過濾重複請求
- 30. Scrapy POST請求不工作