4
我可以使用Watir從網站上抓取數據(使用AJAX),但在沒有監視器的Linux服務器上抓取數據? (linode.com)?我可以使用Watir從沒有監視器的Linux服務器上的網站上抓取數據嗎?
我可以使用Watir從網站上抓取數據(使用AJAX),但在沒有監視器的Linux服務器上抓取數據? (linode.com)?我可以使用Watir從沒有監視器的Linux服務器上的網站上抓取數據嗎?
有幾種方法可以做到這一點:
使用HtmlUnit,無論是Celerity或watir-webdriver(通過remote Selenium2/WebDriver server)。
使用真正的瀏覽器+虛擬X服務器(Xvfb)。我建議使用watir-webdriver的Firefox驅動程序和Headless gem,這是一個簡單的方法來從Ruby中控制它。
這基本上是速度和現實之間的折衷。就個人而言,如果網站有任何複雜的JavaScript或無效的HTML,我會和#2一起去,但這兩種方法都值得調查。
未來,我會密切關注this project,這看起來像一個了不起的想法。
哇,看起來gooooood。在我看來,我將在週末做很多閱讀:-) – Radek 2010-10-05 22:07:39