0
我想從超鏈接中獲取實際的url字符串。我想我的結果被剝離的HTML。如何從使用hpricot的超鏈接中提取網址?
所以,如果我的輸入字符串中的一個是
<a href="http://target.com/resource.tar.gz">resource</a>
我想獲得:
http://target.com/resource.tar.gz
我怎樣才能做到這一點?
我想從超鏈接中獲取實際的url字符串。我想我的結果被剝離的HTML。如何從使用hpricot的超鏈接中提取網址?
所以,如果我的輸入字符串中的一個是
<a href="http://target.com/resource.tar.gz">resource</a>
我想獲得:
http://target.com/resource.tar.gz
我怎樣才能做到這一點?
在Hpricot中,您可以使用方括號訪問元素的屬性(就像訪問Hash中的元素一樣)。所以,用你的例子:
doc = Hpricot('<a href="http://target.com/resource.tar.gz">resource</a>')
puts doc.at('a')['href'] # => http://target.com/resource.tar.gz