2012-06-13 72 views
0

所以我試圖訪問這個網站http://www.engin.umich.edu/htbin/wwwhostinfo?detail=0&display=all&sort=open中的表格,並試圖將它變成一個Elements對象。我只需要第一和第四列。所以我使用jsoup並執行此操作:如何擺脫jsoup中的html,只提取html表格內容?

Document doc = Jsoup.connect("http://www.engin.umich.edu/htbin/wwwhostinfo?detail=0&display=all&sort=open").get(); 
     Elements buildings = doc.select("td:eq(0),td:eq(3)"); 

這應該選擇第一列和第四列。這是做到這一點,但所有的HTML數據以及 我需要跳過網頁上的所有最初的東西「下面的報告...」。我只需要兩列 - Building和Open,這樣我就可以簡單地初始化額外的變量並將建築物中打開的計算機的數量分配給它,最後使用Toast或類似的東西來顯示建築物中打開的計算機的數量屏幕。

目前,我正在使用TextView來顯示數據,並向我展示了我不想要的所有html數據。

TextView tv = new TextView(this); 
     tv.setText(""+buildings); 
     setContentView(tv); 

可以將各個值從元素提取出來?

簡而言之:如何通過跳過所有其他數據並將它們分配給自己的變量來僅提取建築物名稱和打開計算機的數量?

有關如何做到這一點的任何想法?

在此先感謝 - a.v.

+0

你有什麼想法的網絡報廢? –

回答

0

您可以使用JSOUP Cleaner & Whitelist執行該任務。

只要定義什麼不應該被刪除,你很好去!

+0

謝謝!這很快就完成了! – avtri