如何從使用hpricot的超鏈接中提取網址？

我想從超鏈接中獲取實際的url字符串。我想我的結果被剝離的HTML。如何從使用hpricot的超鏈接中提取網址？

所以，如果我的輸入字符串中的一個是

<a href="http://target.com/resource.tar.gz">resource</a>

我想獲得：

http://target.com/resource.tar.gz

我怎樣才能做到這一點？

2011-06-21 Robert

在Hpricot中，您可以使用方括號訪問元素的屬性（就像訪問Hash中的元素一樣）。所以，用你的例子：

doc = Hpricot('<a href="http://target.com/resource.tar.gz">resource</a>') 

puts doc.at('a')['href'] # => http://target.com/resource.tar.gz

2011-06-21 07:52:54

回答