2011-08-10 143 views
1

我想使用一些Ruby庫解析網頁(目錄)並將其存儲到數據庫。目前,我很難選擇什麼樣的圖書館最適合這種目的。我對Hpricot很熟悉,但我現在並不是很疼,現在它處於邊緣。Ruby/Rails HTML頁面解析

P.S或任何類型的數據來解析URL-s?

謝謝!

回答

3

我認爲HTML解析nokogiri open-uri是最好的。

0

爲什麼你在乎圖書館,「現在處於邊緣」?如果你對Hpricot感到滿意,那就使用它。不要把時間浪費在無休止的尋找上:只是開始編寫一個程序。這是我的答案。

0

呵呵,我一直在尋找引述對此事角度來說,Hpricot作家,我發現此評論:

角度來說,Hpricot是黑客_why誰現在已經消失的工作。但 甚至在他失蹤之前nokogiri超過了hpricot的表現。 他甚至啾啾「來電者問:‘我應該使用角度來說,Hpricot或引入nokogiri’如果 你不是我:使用引入nokogiri,如果你是我的。還有剪下來,停止 是我」?

這裏是我引用的評論的鏈接: http://news.ycombinator.com/item?id=1955644

總結:與Nokogiri一起去吧。