像PHP中的DOMDocument類,是否有RUBY中的任何類(即核心RUBY),用於從HTML文檔中解析和獲取節點元素值。在Ruby中解析HTML文檔的方法?
回答
有沒有內置的HTML解析器(但),但一些非常好的可用,特別是Nokogiri。
元回答:對於這些常見的需求,我建議您查看Ruby Toolbox網站。您會注意到Nokogiri是HTML parsers的最佳推薦
您應該檢查出hpricot。它非常好。這不是'核心'紅寶石,但它是一個常用的寶石。
您也可以嘗試Oga Yorick Peterse。
這是一個用Ruby編寫的XML/HTML解析器,它不需要像libxml這樣的系統庫。你可以在這裏找到它。 https://github.com/YorickPeterse/oga
Ruby Cheerio - Ruby中的jQuery風格的HTML分析器。用於爬蟲的Nokogiri的最簡化版本。這是最流行的NodeJS包的紅寶石版本cheerio。
Follow the link for a simple crawler example.
寶石安裝紅寶石cheerio
require 'ruby-cheerio'
jQuery = RubyCheerio.new("<html><body><h1 class='one'>h1_1</h1><h1>h1_2</h1></body></html>")
jQuery.find('h1').each do |head_one|
p head_one.text
end
# getting attribute values like jQuery.
p jQuery.find('h1.one')[0].prop('h1','class')
# function chaining similar to jQuery.
p jQuery.find('body').find('h1').first.text
非常好的方法!不錯的推薦!謝謝@dineshsprabu。 – 2017-04-18 19:22:23
謝謝費爾南多·科什 – dineshsprabu 2017-04-19 07:29:41
- 1. Ruby OptionParser的解析文檔在哪裏?方法?
- 2. 解析HTML文檔?
- 3. 解析Ruby中的XML文檔
- 4. 在html文檔中解析腳註
- 5. HTML DOM文檔解析
- 6. 解析HTML文檔PHP
- 7. DOM文檔解析HTML
- 8. 解析HTML文檔中的子目錄
- 9. 方法解析文檔和規範行
- 10. 解析xml文檔Java「無法解析」
- 11. 如何用ruby解析word文檔?
- 12. 使用Ruby循環解析XML文檔
- 13. Ruby解析CSS文件的HTML
- 14. ruby文檔中的方法「原型」是如何解釋的?
- 15. 在解析文檔
- 16. 無法解析完整的HTML頁面到文檔中
- 17. 無法解析XML文檔
- 18. 解析HTML與引入nokogiri在Ruby中
- 19. 最快的方法解析HTML在Perl
- 20. 解析表中的文檔
- 21. 用ruby解析javap的方法名稱
- 22. PHP DOM文檔不解析/檢索HTML
- 23. 用xmlpullparser解析html-like文檔?
- 24. 使用NekoHTML解析html文檔
- 25. 使用PHP解析HTML文檔
- 26. Jsoup不解析整個html文檔
- 27. 如何使用c解析html文檔#
- 28. 使用HtmlAgilityPack-Xpath解析HTML文檔,RegExp
- 29. 從服務器解析HTML文檔
- 30. 使用JavaScript解析HTML文檔(節點)
角度來說,Hpricot可悲的是沒有更多的。 Nokogiri現在是首選解決方案。 – superluminary 2013-10-14 11:27:44