2009-11-26 34 views
1

如何在android中解析格式不正確的HTML?如何在android中解析(非格式良好的)HTML?

我試圖用XOM和TagSoup,但在創建生成器時,我得到以下錯誤:

11-26 20:42:39.294: ERROR/dalvikvm(1298): Could not find method org.apache.xerces.impl.Version.getVersion, referenced from method nu.xom.Builder. 

,我必須安裝的Xerces使用XOM或者我可以使用tagsoup沒有XOM?

回答

2

您可能會發現JTidy(http://jtidy.sourceforge.net/) - HTMLTidy的端口要足夠輕巧。它根據請求輸出XHTML

+0

Glad它是有益的 – 2009-11-28 12:44:08

0

XOM可能需要Xerces在類路徑中 - 它可能取決於Java的版本。目前我們使用

xercesImpl-2.8.0.jar 
+1

我認爲Xerces本身太重,無法在Android上工作... 我不明白爲什麼我沒有找到關於這樣一個基本的東西,如Android的HTML刮...的信息... – Kristof 2009-11-26 22:14:15

相關問題