2010-01-24 85 views
0

上週我開始寫紅寶石劇本。我需要從網上刮取一些數據,所以我被推薦使用機械化,然後nokogiri如何閱讀nokogiri.org文檔? (紅寶石+機械化+ nokogiri)

Mechanize documentation saysMechanize使用nokogiri來解析html。這對你意味着什麼?你可以像一個nokogiri對象那樣對待機械化頁面。使用機械化導航到您需要刮擦的頁面後,使用nokogiri方法刮擦它。

我知道,我可以使用.xpath .at_xpath因爲它的one answer to my question一部分,但我不知道這些方法的精確語法,差異等。我試圖尋找nokogiri web

我被告知in this answer我經常用text()表達式。這不需要使用Nokogiri。您可以檢索節點,然後調用節點上的文本方法。它便宜得多。我試圖搜索nokogiri web,但沒有找到任何內容。

在那裏有人誰可以幫助我如何閱讀nokogiri文檔

比方說,我想知道如何使用文本方法,而不是文本()。

回答

2

我不確定在閱讀Nokogiri文檔時出現什麼問題。在Google上快速搜索「nokogiri」會返回「nokogiri.org」作爲第一個搜索結果。這是文檔頁面。

在Ruby中,.text().text相同,如果您沒有傳遞參數。 .text().inner_text()的別名,它將「獲取所有包含的節點對象的內部文本」。 Searching nokogiri.org for "text"會讓你開始。

1

我認爲作者的意思之一是該網站上的文檔是而不是標準格式/顯示作爲使用rdoc和各種方法顯示信息的其他網站。例如。 很難看清

要回答,或嘗試 - 我已經有幸在github上搜索使用nokogiri並通過閱讀源代碼從那裏進行項目。