2011-04-29 234 views
0

我需要獲取給定的網頁,然後將HTML標記轉換爲XML標記,並從這些XML標記中創建一棵樹。我怎樣才能做到這一點 ??請告訴我一些很好的鏈接或基於這些教程,順便說一句,我使用的是Java語言。通過java獲取網頁

謝謝。

+0

您是否嘗試過但都寫任何代碼? HTML通常包含無效的分層XML內容。這不是一件容易的事。 – 2011-04-29 18:54:11

回答

1

HttpClient獲取數據。 HtmlCleaner把它變成XML。

都有教程。

+0

+1爲快速觸發手指 – Kal 2011-04-29 18:56:07