2014-01-09 95 views
0

我想刪除Java中的字符串的HTML。如何刪除String的HTML元素?

<hr><b><strong>Task Details</strong></b><hr><b>Date Created: </b> 01/06/2014 07:55pm<br><b>Date Modified: </b> 01/06/2014 07:55pm<br><b>Assigned to: </b> Administrator<br><b>Created By: </b> Administrator<br><b>Status: </b> Not Started<br><b>Description: </b> Test Description<br>. 

上面是我的字符串,我想刪除HTML標記。

+0

是這些HTML標籤?輸入似乎沒有HTML標籤。 –

+0

這個問題還不夠清楚。你在說什麼字符串和什麼HTML標籤?你能否詳細說明這個問題,並提一提你想要達到的目標? – Hrishikesh

+0

'Java'是'JavaScript','Car'是'Carpet'。那麼你使用哪種語言? –

回答

4

也許這將工作:

String noHTMLString = htmlString.replaceAll("\\<.*?>",""); 

它使用正則表達式來刪除字符串中的所有HTML標籤。

更具體地說,它會從字符串中刪除所有XML標籤。所以< 1234>即使不是有效的HTML標籤也會被刪除。但它對大多數意圖和purpouses有好處。

希望這會有所幫助。

這實際上是死的簡單與Jsoup.

public static String html2text(String html) { 
    return Jsoup.parse(html).text(); 
} 
+2

-1您的答案的第一部分直到「希望這有幫助」複製**逐字**和**未歸屬**從[此更早的答案](http://stackoverflow.com/a/4432579/147346 )。除非你是同一張海報,否則這是一個很大的禮節禁忌。 –

1

可以使用Jsoup庫吧。

String str="<h3>My Text</h3>"; 
System.out.println(Jsoup.parse(str).text()); 

上面的代碼條所有HTMS標籤,給文本留下作爲輸出