2012-03-13 157 views
0

我需要解析java中的HTML文件。與XML不同,沒有重複標籤。所以我需要一個能夠解析html文件併到達所有節點的代碼,它包含嵌套標籤等等.HTML代碼不是固定的。換句話說,給定任何HTML代碼,我需要到達HTML中的所有標籤。解析HTML並獲取所有節點

+0

這個問題是有關http://stackoverflow.com/questions/9664778/parsing-html-in- java – 2012-03-13 09:24:48

回答

0

我認爲你需要這個......

var els=document.getElementsByTagName("*"); 
for(var i=0;i<els.length;i+)document.write(els.nodeName+"<br />"); 
+0

我想檢查一下。謝謝。 – 2012-03-13 06:17:27

+0

他似乎在使用Java ... – DanRedux 2012-03-13 06:24:51

+0

不,它不解析最內層的節點。你有其他想法嗎? – 2012-03-13 06:25:21

1
+0

嗯,不能理解。你可否精心準備? – 2012-03-13 06:30:25

+0

這是一種HTML解析器,您可以在java中使用它將以xml格式返回所有html內容,如將標記設置爲節點和其他文本內容以及所有內容。 CHeck示例 – 2012-03-13 06:40:41

+0

這些示例都是命令行。我無法找到java示例。對不起,你在竊聽你。我是一個業餘愛好者。 – 2012-03-13 06:50:40