請看下面的簡單示例:如何防止jsoup轉換特殊字符?
public static void main(String[] args) {
String html = "<html>\n" +
" <head></head>\n" +
" <body>\n" +
" <div> \n" +
" <p> 2 <= X </p> \n" +
" </div>\n" +
" </body>\n" +
"</html>";
Document doc = Jsoup.parse(html);
System.out.println(doc.select("p").outerHtml());
}
此打印出<p> 2 <= X </p>
但我期待着打印出所選擇的HTML部分,因爲它是:<p> 2 <= X </p>
。我如何告訴jsoup不要轉換'<'符號?
您的輸入是無效的HTML。 Jsoup對你來說是正確的。 – 2016-12-16 14:15:19
我無法控制輸入。有沒有辦法告訴jsoup忽略html的有效性,並解析文檔,因爲它是爲了得到輸出? – RedSea