我有一個巨大的Wordpress XML導出。不幸的是,一些混蛋設法將代碼注入到安裝中並將DIV注入到內容中。 現在我想清理那些混亂。這裏是什麼樣子:如何從XML文件中刪除具有樣式屬性的DIV標籤?
<p>Normal Text</p>
<div style="position:absolute;top:-9660px;left:-4170px;"><a href="http://insane.link.com">Insane Linktext</a></div>
<div style="position:absolute;top:-2460px;left:-5370px;"><a href="http://insane.link.com">Another Insane Linktext</a></div>
<p>Normal good people's brains' text</p>
我想過使用一些正則表達式表達式匹配包含STYLE屬性的DIV。可用的工具是Aptana或其他文本編輯器,PHP服務器以及OSX終端。對此有何建議?
感謝和乾杯!
啊,這是正確的做法,發現已經有一些。但標記有時會有所不同,所以我可以只匹配DIV而不是As。我試過'
好吧,我剛剛找到了適合我的解決方案:'
我必須發佈關於正則表達式和XML的強制性健康警告http://stackoverflow.com/a/1732454/169346 – JeremyP 2012-04-25 10:06:53