我有一個HTML字符串像消除HTML標籤
Lorem ipsum <a href='google.com'>google <span>rulz</span></a> not sum
我想刪除所有的HTML標籤,我的意思是我想刪除所有的HTML元素,所以字符串應該轉化爲(在JavaScript)
Lorem ipsum not sum
我想它的匹配(和替換)它尤斯:
<([a-z][a-z0-9]*)\b[^>]*>.+?<\/([a-z][a-z0-9]*)\b[^>]*>
的問題是,我得到
Lorem ipsum </a> not sum
因爲正則表達式替換爲「google rulz」,但我希望它替換孔html標記,所以我發現它發生了。
有什麼想法?
你不使用的HTML解析器的原因嗎? – robert 2011-02-02 12:29:34
而不是刪除一個正則表達式中的打開和關閉標籤,你試過替換*任何*標籤:`<.*?>`?這樣,打開和關閉標籤將被單獨移除,並且不需要擔心匹配它們。 – JaredC 2011-02-02 12:32:36