2015-05-23 124 views
2

我有這樣的HTML代碼:JSOUP:如何獲得Href?

<td class="topic starter"><a href="http://www.test.com">Title</a></td> 

我想提取「標題」和URL,所以我這樣做:

Elements titleUrl = doc.getElementsByAttributeValue("class", "topic starter"); 
String title = titleUrl.text(); 

而這個工程的標題,但對於網址我試過以下內容:

String url = titleUrl.html(); 
String url = titleUrl.attr("a [href]"); 
String url = titleUrl.attr("a[href]"); 
String url = titleUrl.attr("href"); 
String url = titleUrl.attr("a"); 

但是沒有人工作,我無法獲取URL。

回答

4

試試這個:

Element link = doc.select("td.topic.starter > a"); 
String url = link.attr("href"); 

您先選擇a元素,然後提取其屬性href

+1

我解決了: titleUrl.select(「a」)。attr(「href」)。toString() – helloimyourmind

+0

看看我編輯的文章,這應該工作。不,你不能從'td'元素中提取url,因爲它是一個不同元素的屬性。 – Timo

+1

@helloimyourmind那麼,這與我的代碼基本上是一樣的,在兩個選擇而不是一個。你也不應該要求'toString()',因爲'attr()'已經返回一個字符串。 – Timo