目前,我的Nokogiri腳本遍歷Google的SERP,直到找到目標網站的位置。它針對每個用戶指定的每個網站的每個關鍵字執行此操作(用戶的上網量爲關鍵字&)。我應該如何在一天中安排很多Google搜索刮擦?
現在,它運行在一個每天都很難安排的耙子中,並通過循環遍歷數據庫中的所有網站來一次性批量處理所有的瑕疵。但是我擔心可擴展性和谷歌與一批請求蜂擁而至。
我想要一個解決方案,可以在一天中進行縮放並運行這些刮擦。我不確定什麼樣的解決方案可用或我真正在尋找什麼。
注意事項:隨着用戶添加和刪除他們的網站和關鍵字,網站/關鍵字的數量每天都在變化。我不打算讓這個問題變得多餘,但是Beanstalkd/Stalker(job queuing)可以用於這種事情嗎?