我需要從大量的html頁面中刪除一些標籤。 最近我在記事本++Notepad ++正則表達式刪除樣式
中發現了正則表達式的選項。 我需要什麼?
例子:
<p class=MsoNormal style='margin-left:19.85pt;text-indent:-19.85pt'><spanlang=NL style='font-size:11.0pt;font-family:Symbol'>·<span style='font:7.0pt "Times New Roman"'> </span></span><span lang=NL style='font-size:9.0pt;font-family:"Arial","sans-serif"'>zware uitvoering met doorzichtige vulruimte;</span></p>
我需要刪除有關的造型,類和id的一切。所以我只需要有乾淨的標籤沒有別的。
任何人都可以幫助我在這一個?
親切的問候
編輯 通過引擎收錄檢查整個文件:http://pastebin.com/0tNwGUWP
不要使用正則表達式來解析HTML:http://stackoverflow.com/a/1732454/2812842 –
'更正:'不要使用正則表達式來當嵌套在自己內部的標籤涉及到時解析HTML –
你有'