2009-12-14 43 views
0

假設是網頁使用正確的標籤進行編碼。我如何將它轉換爲XML文件?我認爲大多數網頁可以被視爲dom樹...我如何將它轉換爲XML文件?如何將網頁轉換爲使用java的xml文檔?

+0

HTML不是HTML的子集嗎?我想你需要給我們更多關於你想要做什麼的信息。 – morgancodes 2009-12-14 10:15:59

+0

html頁面可以被視爲dom。否則html頁面可以轉換爲dom。我想從dom轉換到xml。 – professionalcoder2010 2009-12-14 10:17:33

回答

0

JTidy讀取HTML並將其呈現爲DOM。一旦你將HTML作爲一個DOM,你應該能夠處理它並把它寫成XML。

要輸出DOM,請參閱example code here以及特別的XMLSerializer。

+0

感謝您的鏈接。如何將其轉換爲xml文件? – professionalcoder2010 2009-12-14 10:23:16