我還沒有找到任何文檔或教程。有這樣的事嗎?如何在Nokogiri中使用XPath?
doc.xpath('//table/tbody[@id="threadbits_forum_251"]/tr')
上面的代碼會得到我的任何table
,任何地方,有一個tbody
孩子與屬性id
等於「threadbits_forum_251」。但爲什麼它以雙重//
開頭?爲什麼最後有/tr
?有關更多詳細信息,請參閱「Ruby Nokogiri Parsing HTML table II」。
誰能告訴我怎麼href
,id
,alt
,src
等,採用引入nokogiri提取?
td[3]/div[1]/a/text()' <--- extracts text
我該如何提取其他東西?
@Rubens謝謝你。你是對的我需要閱讀XPath Tutorial.I認爲這是我需要閱讀的nokorigi文檔...你知道是否有任何工具可以給我完整的Xpath,如果我點擊並在HTML頁面上的對象? – Radek 2010-01-17 11:50:58
我不知道,但XPath並不那麼辛苦;考慮你的文件系統,並假設每個文件夾都是一個XML元素;所以,當你選擇你的'system32'文件夾時,你會得到'\ windows \ system32'路徑;只需用'/'替換'\\'',考慮以'@'開頭的屬性和'']'的條件,你很好去 – 2010-01-17 12:01:48
我知道這是一個較老的答案,但是xpath教程的鏈接是現在打破了。我認爲現在應該是http://www.w3schools.com/xsl/xpath_intro.asp – Axiombadger 2016-02-17 13:06:41