刪除標籤和內容這是我的RSS文件的示例結構:正則表達式從RSS文件
<item>
<title>My Title</title>
<link>http://www.link.com</link>
<description>The description</description>
<author>Blah Blah</author>
<pubDate>Thu, 26 Jul 2012 10:17:15 -0400</pubDate>
<media:content url="myimage.jpg">
<media:title>sdafsd</media:title>
</media:content>
<position>1</position>
</item>
如何刪除筆者標記及其內容,整個媒體:內容標記及其內容,並使用PHP正則表達式完全從文件中獲取位置標記及其內容?
謝謝!
什麼?在stackoverflow上有很多答案,你不應該試圖用正則表達式來做HTML,但是在XML的情況下,它應該更加明顯。它是XML,爲什麼不使用簡單的XML讀取器而不是正則表達式? –
我想指出,本網站上的大多數人在使用正則表達式處理HTML時只是喋喋不休。對於某些類型的刮擦,你沒有理由不這樣做。只有當您嘗試匹配需要保持計數的事物(如嵌套標記,括號等)時,纔會更好地使用DOM解析器。 – FtDRbwLXw6
我需要使用正則表達式的原因有點複雜,但我基本上需要獲取現有的RSS文件,刪除它的那些部分,然後將其回顯出來,就好像它是原始RSS文件一樣。 – codeman