2012-02-18 72 views
0

假設我有解析HTML的行了下面......解析只是在Ruby中通過引入nokogiri在HTML節點的內容

<a href="http://www.google.com" class="blah"><img src="logo.png" border="0"></img><br><span class="red">Go to google!</span></a> 

這僅僅是一個例子...但我怎麼會去剝離一切除了以下內容:

http://www.google.com 
logo.png 
Go to google! 

此外,是否有可能搜索通配符?

回答

1

也許是這樣的:

doc = Nokogiri::HTML '<a href="http://www.google.com" class="blah"><img src="logo.png" border="0"></img><br><span class="red">Go to google!</span></a>' 
doc.xpath('//*/@href|//*/@src|//*/text()').map(&:to_s) 
+0

這將趕上通配符? – user1015523 2012-02-18 15:45:16

+0

我不確定你的意思是通配符 – pguardiario 2012-02-18 23:13:21