0
我有結構的html文件是這樣的:打破一個HTML文檔插入組件
<div id = 'd1'>
<p>...</p>
<p>...</p>
<!-- this [SurveyButton] is pure text and doesn't belong to any element under this level -->
[SurveyButton]
<div>...</div>
</div>
我想這個HTML文件分解爲三個部分:
1:
<p>...</p>
<p>...</p>
2:
[SurveyButton]
3:
<div>...</div>
我想獲取每個部分的字符串格式。 我現在的一些想法是將"[SurveyButton]"
替換爲"<p>[SurveyButton]</p>"
,我可以得到所有<p></p>s
並將前兩個組合爲一個。在這種情況下,我處理了前兩部分。但棘手的是,在第三個<div></div>
內也有<p>s
。我找不到一個通用的方法。 我如何做到這一點(更好的與Jsoup庫)?謝謝。
SO不是代碼寫入服務。請向我們展示您的嘗試。 – Alohci