0 我需要獲取給定的網頁,然後將HTML標記轉換爲XML標記,並從這些XML標記中創建一棵樹。我怎樣才能做到這一點 ??請告訴我一些很好的鏈接或基於這些教程,順便說一句,我使用的是Java語言。通過java獲取網頁 謝謝。 來源 2011-04-29 Anis +0 您是否嘗試過但都寫任何代碼? HTML通常包含無效的分層XML內容。這不是一件容易的事。 – 2011-04-29 18:54:11
1 HttpClient獲取數據。 HtmlCleaner把它變成XML。 都有教程。 來源 2011-04-29 18:54:04 +0 +1爲快速觸發手指 – Kal 2011-04-29 18:56:07
0 看看阿帕奇http://hc.apache.org/httpcomponents-client-ga/和http://htmlcleaner.sourceforge.net/ 來源 2011-04-29 18:55:45 Kal
您是否嘗試過但都寫任何代碼? HTML通常包含無效的分層XML內容。這不是一件容易的事。 – 2011-04-29 18:54:11