Q

使用亞馬遜網絡服務自動計劃Scrapy爬蟲

2015-04-03 107 views 3 likes

3

我有一個使用Python的Scrapy的爬蟲/蜘蛛，我想使用Amazon Web服務安排每日爬行。使用亞馬遜網絡服務自動計劃Scrapy爬蟲

我想要做的是，每天都說01:00 UTC。我想要創建一個ec2實例並啓動Scrapy蜘蛛並運行抓取，並且完成後我希望ec2實例被終止。

我不希望ec2實例遺留下來並且運行並增加額外的成本/費用，因爲將來我會添加更多的蜘蛛，並且可能導致十幾個被動實例每天20小時無所事事。

我發現一對夫婦的帖子談論使用Scrapy與EC2的：

但他們都似乎需要您推出該腳本每次您想要安排抓取時，請從您的本地計算機上下載。它似乎不會自動完成。我希望我的腳本每年365天運行10年以上，而且我不想每晚睡覺前都做這個腳本。

有人可以描述這是如何使用亞馬遜網絡服務完成的嗎？

2015-04-03 Marcus Lind

A

回答

3

我認爲使用crontab或python-scheduler隨着scrapyd將做詭計

2015-04-08 08:23:00 Jithin

相關問題