2012-09-28 51 views
-1

我有一個像正則表達式(Java)來提取href屬性值

<a href="/abc/xyz/ccc" id="link_abc" title="bala" name="link_abc"></a> 

,所以我存儲在名爲tempString字符串該值在XML文件標籤; 現在我必須解析tempString,以便我只能提取href屬性值。 我期待的輸出是/ abc/xyz/ccc。我正在尋找Java正則表達式來做到這一點。

我真的很感激你對此的幫助。

Regards, Ramakrishna。

+2

爲什麼不使用XML解析器? – DNA

+1

@DNA:首先,他需要確保HTML格式符合XML格式,例如通過符合XHTML標準。或者更簡單,只需使用HTML解析器即可。 –

+0

XML與使用正則表達式解析XML的難度類似,所以http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 –

回答

1

爲什麼不使用jsoup

即:

Document doc = Jsoup.connect("http://yoururl.com/").get(); 
Elements link = doc.select("#link_abc"); 
String href = link.attr("href"); 
0

你可以使用String.split();

String h = "<a href=\"/abc/xyz/ccc\" id=\"link_abc\" title=\"bala\" name=\"link_abc\">planx</a>"; 
System.out.println(h.split("href")[1].substring(2).split("\"")[0]); 


OUTPUT: /abc/xyz/ccc