我在scrapy中開發了幾個蜘蛛&我想測試Heroku雲上的那些蜘蛛。有人對Heroku雲中如何部署Scrapy蜘蛛有任何想法嗎?如何在Heroku雲上部署Scrapy蜘蛛
9
A
回答
11
是的,在Heroku上部署和運行Scrapy蜘蛛相當簡單。
下面是使用一個真正的Scrapy項目爲例步驟:
克隆項目(請注意,它必須有一個
requirements.txt
文件的Heroku將其識別爲一個Python項目):git clone https://github.com/scrapinghub/testspiders.git
將cffi添加到requirements.txt文件(例如cffi == 1.1.0)。
創建Heroku的應用程序(這將添加一個新的Heroku遠程Git):
heroku create
部署項目(這將需要一段時間,在第一時間,將塞建成時):
git push heroku master
運行你的蜘蛛:
個
heroku run scrapy crawl followall
一些注意事項:
- Heroku的磁盤是短暫的。如果你想存儲在一個固定的地方被刮取的數據,你可以使用S3 feed export(通過追加
-o s3://mybucket/items.jl
)或使用一個插件(如MongoHQ或Redis去)並寫一條管道來存儲你的物品 - 這將是酷在Heroku上運行Scrapyd服務器,但目前不可能,因爲
sqlite3
模塊(Scrapyd要求)在Heroku上不起作用 - 如果您想要一個更復雜的解決方案來部署Scrapy蜘蛛,請考慮設置您自己的Scrapyd server或使用託管服務,如Scrapy Cloud
相關問題
- 1. Scrapy與Scrapy蜘蛛
- 2. scrapy:蜘蛛中的小蜘蛛?
- 3. Scrapy DOMAIN_NAME的蜘蛛
- 4. Python的scrapy蜘蛛
- 5. 如何比較每個Scrapy蜘蛛項目與另一個Scrapy蜘蛛項目?
- 6. 如何整合蜘蛛和scrapy-ctl.py
- 7. 如何重新啓動Scrapy蜘蛛
- 8. 如何限制蜘蛛使用scrapy
- 9. scrapy蜘蛛碼校驗
- 10. Scrapy蜘蛛不工作
- 11. Scrapy - 運行蜘蛛多次
- 12. Scrapy雅虎集團蜘蛛
- 13. Scrapy找不到蜘蛛
- 14. Scrapy蜘蛛過早關閉
- 15. scrapy蜘蛛沒有發現
- 16. Scrapy蜘蛛Xpath的選擇
- 17. Scrapy CrawlSpider沒有蜘蛛
- 18. Scrapy蜘蛛登錄問題
- 19. Scrapy管理動態蜘蛛
- 20. Scrapy蜘蛛錯誤處理
- 21. scrapy中的連環蜘蛛
- 22. Scrapy蜘蛛不爬行
- 23. 使用Scrapy創建蜘蛛,蜘蛛生成錯誤
- 24. Scrapy從主蜘蛛運行多個蜘蛛?
- 25. 如何在scrapy蜘蛛上實現請求功能
- 26. Scrapy:蜘蛛沒有任何返回
- 27. 錯的Xpath在IMDB蜘蛛scrapy
- 28. Scrapy - 檢索蜘蛛對象在dupefilter
- 29. 在scrapy中運行多個蜘蛛
- 30. 在Scrapy中使用遞歸蜘蛛[Python]
scrapy-heroku是專門爲此目的而編寫的:http://pypi.p ython.org/pypi/scrapy-heroku –