我想通過看其在Chrome的HTML,並搶得使用引入nokogiri數據刮網站。問題是,有些標籤是動態生成的,而且在使用open-uri時,它們不會顯示打開(url)請求。有沒有辦法「強制」一個網站動態生成一個工具,如打開的uri閱讀的內容?入門動態生成HTML隨着引入nokogiri /打開URI
5
A
回答
4
如果通過開放-URI閱讀它不會產生你所需要的內容,然後有很好的機會在客戶端生成包含JavaScript內容。
這可能是個好消息 - 通過檢查AJAX請求的頁面做,你可能會發現你要尋找的,然後你就可以申請直接解析內容的JSON飼料。這將使您無需挖掘HTML即可獲得數據 - 方便!
如果不出於某種原因,不過,你會需要一些樣的瀏覽器打開網頁,讓它執行其客戶方的Javascript,然後將得到的DOM轉儲到HTML。類似PhantomJS是這類工作的絕佳選擇。
+0
小費#1爲我節省了大量的時間。 –
相關問題
- 1. 引入nokogiri,開URI和Unicode字符
- 2. 引入nokogiri不能退出打開URL
- 3. 與引入nokogiri
- 4. 訪問HTML中引入nokogiri
- 5. 使用引入nokogiri
- 6. 與引入nokogiri
- 7. 在引入nokogiri
- 8. 與引入nokogiri
- 9. 與引入nokogiri
- 10. 黃瓜引入nokogiri
- 11. EOF與引入nokogiri
- 12. 動態生成輸入域
- 13. 解析HTML與引入nokogiri在Ruby中
- 14. 節點添加到XML使用引入nokogiri :: XML ::生成器
- 15. 紅寶石引入nokogiri - 如何防止引入nokogiri從打印HTML字符實體
- 16. 引入nokogiri,JRuby中
- 17. 引入nokogiri問題
- 18. 查找引入nokogiri
- 19. 引入nokogiri解析
- 20. 通過引入nokogiri
- 21. 使用引入nokogiri
- 22. 引入nokogiri解析
- 23. 如何使用引入nokogiri
- 24. DOM刮使用引入nokogiri
- 25. 引入nokogiri:解析HTML表的沒有開放標籤
- 26. 集成入門
- 27. 移動開發入門
- 28. 生成動態html
- 29. 如何獲得使用引入nokogiri使用引入nokogiri
- 30. 什麼是忽略與引入nokogiri :: XML空節點::生成器
看一看[機械化](http://mechanize.rubyforge.org/)。我認爲它可以做你想做的事。 – Aaronneyer
根據*網站如何生成其內容,您可能需要首先執行JavaScript。 – tessi
有時在複雜的網站中機械化卡住。如果JRuby是一個選項,並且機械化不起作用,我還會看看[Celerity](http://celerity.rubyforge.org/)。 – yonosoytu