我想將Htmlpage轉換爲pdf。但HtmlPage有很多標籤還沒有關閉:將結束標記添加到HtmlElement(HtmlUnit)
<hr>
<br>
因此我無法創建PDF。如何通過在Java上使用HtmlUnit來關閉這些標籤。我要的是:
<hr />
<br />
感謝
我想將Htmlpage轉換爲pdf。但HtmlPage有很多標籤還沒有關閉:將結束標記添加到HtmlElement(HtmlUnit)
<hr>
<br>
因此我無法創建PDF。如何通過在Java上使用HtmlUnit來關閉這些標籤。我要的是:
<hr />
<br />
感謝
感謝答案,我錯了。問題不在於這些html標籤。由於我想轉換的htmlpage包含非法的xml字符,因此我無法將其轉換。
我找到了使用Xerces庫的XMLChar.isValid方法的解決方案。 此外,我不得不刪除所有腳本和風格與此代碼htmlpage的標籤:
final DomNodeList<HtmlElement> scriptElements = html.getElementsByTagName("script");
if (!scriptElements.isEmpty()){
for (HtmlElement scriptElement : scriptElements){
scriptElement.removeAllChildren();
}
}
其實這些標籤不應該有結束標籤。在此請看:
權,但他們需要的空標籤在XHTML:'
',''
– 2011-12-28 13:11:33