2011-12-27 56 views

回答

0

感謝答案,我錯了。問題不在於這些html標籤。由於我想轉換的htmlpage包含非法的xml字符,因此我無法將其轉換。

我找到了使用Xerces庫的XMLChar.isValid方法的解決方案。 此外,我不得不刪除所有腳本風格與此代碼htmlpage的標籤:

final DomNodeList<HtmlElement> scriptElements = html.getElementsByTagName("script"); 
if (!scriptElements.isEmpty()){ 
    for (HtmlElement scriptElement : scriptElements){ 
     scriptElement.removeAllChildren(); 
    } 
} 
0

您可以使用HTML Tidy糾正HTML。 Java庫是JTidy。 JTidy可以配置爲生成XHTML。

相關問題