我正在使用Ruby on Rails和Mechanize庫來抓取商店網站。問題在於我無法抓取某些元素的很多次。但是,當我在網站上查看源代碼時,我可以看到這一點。最佳網頁抓取Ruby on Rails庫,處理由javascript生成的動態HTML
例如,沃爾瑪的類別(在這種情況下,它是「健康」)是不可見的。我相信這是因爲它是動態生成的HTML(例如來自javascript)。爲了減少這一點,我需要一個瀏覽器來處理Web請求。
http://www.walmart.com/ip/Replacement-Sensor-Module-for-AlcoMate-Prestige-Breathalyzer/10167376
我也使用在Amazon EC2上一臺Linux機器。安裝用於UI抓取的瀏覽器會很困難。有沒有可以幫助我的Rails gem/plugin?
謝謝,所有!