2013-09-11 58 views
0

這個鏈接 - http://en.wikipedia.org/wiki/Help:Wiki_markup#Text_formatting%20first%20point - 規定,無論何時一個粗體或斜體的文本,它都包含在兩個撇號中''爲''文字''在3撇號爲'''粗體文本'''和5'撇號'''' 'bold italics''''',我希望能夠接受一個字符串,它具有這種類型的格式作爲輸入作爲輸入到函數中,並從字符串中移除這種標記以返回乾淨的文本,什麼樣的正則表達式,我應該用java編寫來實現這一點,我對正則表達式很陌生,對這樣做毫無頭緒。樣本內容 -從維基百科XML文本中刪除文本和斜體格式?

輸入

排列了他# '' '89' '' 的前500單曲力士

輸出

排列了他#89頂500選拔摔跤手

+0

String.replaceAll( 「'」, 「」); – newuser

回答

0

嘗試,replaceAll()

String sample = "ranked him #'''89''' of the top 500 singles wrestlers"; 
    System.out.println(""+sample.replaceAll("'", "")); 

輸出:

ranked him #89 of the top 500 singles wrestlers 
0

您可以用以下正則表達式快速替換2-3個撇號組:

[']{2,3}

搜索該模式並將其替換爲無。這應該起作用,因爲你並沒有試圖提取匹配。

+0

,如果有5個撇號,我該怎麼做,最重要的是如何從考慮中的字符串中刪除它們。 – AnkitSablok

+0

嘗試replaceAll方法。在上述模式中,['] {2,3}表示2到3之間的數字。您可以將這些數字更改爲您喜歡的任何範圍,或者,如果需要,可以使用['] {5}運行第二次替換。 – TeejMonster