2012-08-22 22 views
0

,大家下午好,首先我希望這是正確的地方要問這個。我擔心的問題可能被關閉,因爲它是在錯誤的地方,但我認爲它適合在這裏所以這裏去...的Android - 刮痧HTML從一個DIV類重複

我想從網頁刮信息,並在Android窗口小部件顯示它。我想從一個名爲「blogbody」的類中獲取信息,但這個類在網頁中多次出現。我需要的信息是「blogbody」的第三個實例,我該如何正確地獲取這些信息?

下面是從網站的示例(www.crossfit.com)。

<td width="440" rowspan="2" align="left" valign="top" bgcolor="#FFFFCC" border="0" cellspacing="2" cellpadding="0"> 
<table width="440" border="0" cellspacing="0" cellpadding="2"> 
    <tr> 
    <td align="left" valign="top">  
    <div class="date"> August 17, 2012 </div>  
    <div class="blogbody">  
    <a name="8553"></a> 
    <h3 class="title">Friday 120817</h3> 
    <p>Snatch balance 1-1-1-1-1-1-1</p> 
    <p>Post loads to comments.</p> 

回答

1

您可以使用一個很好的HTML解析器,我建議JSoup,它相當快&如果您需要在未來的變化非常靈活,它的使用方法也很簡單。 您將能夠找到堆棧溢出本身許多有益的問題。

我希望它有幫助。

+0

我一直在嘗試Jsoup但真的感到不知道如何的「blogbody」用途的不同,我只想要使用它的第三個實例進行區分。 – user1561757

+0

一種方法是通過'getAllElements()'獲取共同父項的所有子項,然後通過循環遍歷到目標div,在這個循環中檢查子項的類。 –

+0

是的,但我怎麼從階級區分,如果他們都被命名一樣嗎?這是我不明白的。循環如何找到我需要的東西? – user1561757