我使用這個模式刪除所有的HTML標籤(Java代碼):如何讓HTML標籤中指定
String html="text <a href=#>link</a> <b>b</b> pic<img src=#>";
html=html.replaceAll("\\<.*?\\>", "");
System.out.println(html);
現在,我想保持標籤<a ...>
(與</a>
)和標籤<img ...>
我想要的結果是:
text <a href=#>link</a> b pic<img src=#>
如何做到這一點?
我不需要HTML解析器要做到這一點,
,因爲我需要這個正則表達式來篩選大量的HTML代碼片段,
所以,我想用正則表達式
解決方案
這可能是跑題了,但你有HTML的例子是無效的 - 你也可以看到從事實上它把SO的語法高亮顯示出來...... – teukkam 2010-09-24 09:25:03
它們完全有效。 HTML不需要引用屬性值,也不需要作者關閉'img'標籤(等等)。 – 2010-09-24 09:33:30