0
例如,對於一個HTML文檔:有沒有辦法在DOM中的HTML標籤之間提取文字逐字?
<html>
<body>
<p>Hello <b>world</b></p>
</body>
</html>
我知道我可以使用getTextContent()
獲得"Hello world"
,但有一種方式來獲得"Hello <b>world</b>"
?
例如,對於一個HTML文檔:有沒有辦法在DOM中的HTML標籤之間提取文字逐字?
<html>
<body>
<p>Hello <b>world</b></p>
</body>
</html>
我知道我可以使用getTextContent()
獲得"Hello world"
,但有一種方式來獲得"Hello <b>world</b>"
?
在Java中,你可以申請一個XSLT轉換:https://docs.oracle.com/javase/tutorial/jaxp/xslt/writingDom.html
你需要的是檢索元素子樹的XML內容。有在SO解決這個問題的幾個問題: How to I output org.w3c.dom.Element to string format in java?
對不起,我有一個快速瀏覽一下API(我並不是一個真正的Java開發人員,所以我有沒有真正的Java DOM庫經驗),我認爲你也遇到了同樣的問題。當您擁有DOM時,原始內容會丟失。 – Manngo
我是你的例子,你已經省略了__Hello__周圍的空格。這是計劃的一部分嗎? – Manngo
不,讓我編輯文本 –