2010-12-15 70 views
5

我正在尋找TagSoup和jTidy庫的文檔(如果可能的話,正式文檔)。jTidy和TagSoup文檔

我想使用這個庫來操作html「tagsoup」文件,這些文件包含具有不同名稱空間(html,html,xhtml或html5)標籤之間混合的xml標籤。

我已經測試過HTMLCleaner,NekoHTML和Jericho,但是除了最簡單的例子來清除文件之外,我沒有找到jTidy和TagSoup的文檔。

我需要的文檔有關操作內容,更換標記,提取信息,等等

感謝

注: 測試結束後所有的選項,我用StAX的/Woodstox

+2

D你認爲你是[Jsoup](http://jsoup.org)?它不能做[更好/更容易](http://stackoverflow.com/questions/3152138/what-are-the-pros-and-cons-of-the-leading-java-html-parsers)。它還有一個很好的[Cookbook](http://jsoup.org/cookbook/)。 – BalusC 2010-12-15 17:01:49

+0

我在測試Jsoup。她看起來很簡單,但查看示例代碼,似乎沒有線程安全性。我對嗎? – angelcervera 2010-12-15 17:59:05

+0

難道是我還是Jsoup不支持輸出流? – slott 2015-09-27 17:50:06

回答