2016-12-16 24 views
0

我有結構的html文件是這樣的:打破一個HTML文檔插入組件

<div id = 'd1'> 
    <p>...</p> 
    <p>...</p> 

    <!-- this [SurveyButton] is pure text and doesn't belong to any element under this level --> 
    [SurveyButton] 

    <div>...</div> 
</div> 

我想這個HTML文件分解爲三個部分:

1:

<p>...</p> 
<p>...</p> 

2:

[SurveyButton] 

3:

<div>...</div> 

我想獲取每個部分的字符串格式。 我現在的一些想法是將"[SurveyButton]"替換爲"<p>[SurveyButton]</p>",我可以得到所有<p></p>s並將前兩個組合爲一個。在這種情況下,我處理了前兩部分。但棘手的是,在第三個<div></div>內也有<p>s。我找不到一個通用的方法。 我如何做到這一點(更好的與Jsoup庫)?謝謝。

+3

SO不是代碼寫入服務。請向我們展示您的嘗試。 – Alohci

回答

-2

有一些庫可以執行HTML解析。 JSoup浮現在腦海中,但也有其他人。

+0

OP的問題是'我該怎麼做(用Jsoup庫更好)?' – Joe