2012-06-11 26 views
0

閱讀Jsoup的文檔我不明白Jsoup在解析html文件之前是否應用了Tidy。 在這種情況下,可以禁用tidy?Jsoup和解析器的整潔

您是否知道沒有整理頁面源代碼的其他Java HTML5解析器?
謝謝。

+1

你是什麼意思的tidyfication? –

+0

「整理」我的意思是「清理格式不正確和錯誤的HTML」(如JTidy,Html_Tidy和許多其他「Something-Tidy」libreries所做的)。我需要一個Java Html5分析器來解析雜亂的html .... –

+0

IDK,如果有的話。你有沒有嘗試過使用本地Java API?它會爲你提供所有的數據,並帶有自己的縮進。我會通過一種方式發佈答案 –

回答

0

This Oracle article可能會解決您的問題。它是本地API,它可以做你想做的。簡單而有效