2011-10-02 20 views
0

所以我正在跟蹤和跟蹤應用程序。 ,我需要從該網站提取信息: http://www.postdanmark.dk/tracktrace/TrackTrace.do?i_stregkode=RA076673982CN從Android的網站獲取具體的東西

我的問題是,我不知道如何挑選這部分:

  1. 2011年9月09:47 Ankommet直到DANMARK
  2. 2011年9月07 :17 Ankommet直到omdeling 6710埃斯比V Posthus
  3. 2011年9月11時57 Udleveret直到普里瓦

和鄰只有那一部分。

這裏是我的代碼,下載整個HTML頁面:

try { 
     HttpClient client = new DefaultHttpClient(); 
     String getURL = "http://www.postdanmark.dk/tracktrace/TrackTrace.do?i_stregkode=RA076673982CN"; 
     HttpGet get = new HttpGet(getURL); 
     HttpResponse responseGet = client.execute(get); 
     HttpEntity resEntityGet = responseGet.getEntity(); 
     if (resEntityGet != null) { 
        //do something with the response 
        Log.i("GET RESPONSE",EntityUtils.toString(resEntityGet)); 
       } 
} catch (Exception e) { 
    e.printStackTrace(); 
} 

我已經看過幾個環節,我不能似乎發現了什麼,說明如何獲得一個HTML網站,如某一部分的:

<tbody> 

<tr> 
<td valign="top">19. september 2011</td> 
<td valign="top">09:47</td> 
<td valign="top">Ankommet til DANMARK</td> 
</tr> 

<tr> 
<td valign="top">20. september 2011</td> 

<td valign="top">07:17</td> 
<td valign="top">Ankommet til omdeling 6710 Esbjerg V Posthus</td> 
</tr> 

<tr> 
<td valign="top">20. september 2011</td> 
<td valign="top">11:57</td> 
<td valign="top">Udleveret til privat</td> 

</tr> 

</tbody> 

我需要我的解析器來得到的那部分,但我還沒有發現或瞭解如何:(

你們中的任何人都可以向我展示如何做到這一點的例子嗎? : -/

回答

1

您需要使用類似TagSoup/etc的語法解析HTML並提取所需的數據。 (不知道這是否適用於Android)。你可以嘗試使用正則表達式來拔不出來,但是......

RegEx match open tags except XHTML self-contained tags

+0

那麼android是java的,所以java中必須有一些方法,我不知道如果tagsoup方法在java中工作,我從來沒有在 – BoinQ

+0

之前做過,因爲我可以在源代碼中看到它的網站,我需要限制的httpget到和這兩個標籤之間的內容,然後得到解析不知何故我的佈局。 – BoinQ

+0

GET將獲得頁面;你不能「限制」GET。 –