2015-12-08 34 views
0

我有一個python web爬蟲獲取信息並將其放入SQL中。現在我也有php頁面,它從SQL中讀取這些信息並表示它。問題是:爲了讓爬蟲程序正常工作,我的電腦必須保持24/7的工作狀態。我有簡單的家用電腦 - 所以它是一個問題。是否有不同的方式來運行網絡爬蟲?或者我必須在我的電腦上運行它?如何有效地運行python web爬蟲

回答

1

如果您正在監控不斷更新的頁面,那麼您需要在的一些計算機上運行它。您可以使用cron作業或連續循環(有一些監控)。如果您不想在您的家用機器上運行它,我會建議您獲得一個免費的AWS賬戶。你可以得到一個EC2微型實例,它將允許你運行你的python腳本和一個S3數據庫實例,它將允許你存儲信息。

這是一個link to AWS