2008-10-21 29 views
4

我正在嘗試使用JTidy來執行XHTML DOM解析,而這看起來相當違反直覺。特別是,有解析HTML的方法:JTidy Node.findBody() - 如何使用?

Node Tidy.parse(Reader, Writer) 

而得到<體/節點的>,我想,我應該使用

Node Node.findBody(TagTable) 

我應該從哪裏得到的是一個實例TagTable? (構造函數被保護,並且我還沒有找到工廠來生成它。)

我使用JTidy 8.0-SNAPSHOT。

回答

6

我發現有簡單的方法來提取身體:

 
tidy = new Tidy(); 
tidy.setXHTML(true); 
tidy.setPrintBodyOnly(true); 

然後用整理讀寫器對。

很簡單,因爲它應該是。

3

你可以使用parseDOM方法來代替,它會給你一個org.w3c.dom.Document回:

Document document = Tidy.parseDOM(reader, writer); 
Node body = document.getElementsByTagName("body").item(0);