2015-11-24 110 views
0

我想通過機械化加載以下頁面動態頁面:刮使用機械化和Ruby

http://www.amazon.com/dp/B014R6MVH2

產品說明DIV(DIV ID =「產品描述)似乎是一個JavaScript驅動部分,正因爲如此,不可用機械化。

是否有任何解決這個?也許一塊寶石,我可以用它來執行JavaScript,看到了部分?

另一個選擇可能是使用無頭瀏覽河我嘗試過硒,但它比機械化慢得多。

+0

歡迎堆棧Overflow.This覆蓋堆棧溢出多次,並在互聯網上。你在哪裏看,你有什麼嘗試,爲什麼沒有這些頁面幫助?如果你做一些搜索,你會發現你的問題的解決方案。 –

+0

你好。在發佈這個問題之前,我已經查看了Stack Overflow和互聯網。我之前在這裏找到的最佳解決方案是使用Execjs(Ruby Gem)和機械化來提取javascript,但沒有解釋如何這樣做。其他人推薦無頭瀏覽器,但是硒(例如)資源非常沉重,無法在性能方面比較機械化。 –

回答

0

它爲我的作品:

agent = Mechanize.new 
page = agent.get 'http://www.amazon.com/dp/B014R6MVH2' 
page.at('#productDescription .content').text 
#=> Description This item is a simple and useful wedding banner.... 
+0

謝謝 - 與默認機械化用戶代理正常工作,但在使用自定義用戶代理時停止工作 –