2011-10-10 17 views
1

我從我的博客拉動rss提要,但是我希望刪除wordpress添加到我的圖像末尾的查詢字符串。正則表達式刪除/替換查詢字符串RSS提要內容塊

到目前爲止,我嘗試了一些正則表達式,但到目前爲止還沒有能夠拿出一個從rss提要的cdata部分的內容塊中刪除?w=400&h=222

任何想法傢伙?

感謝

[編輯]

飼料的CDATA部分看起來是這樣的:

<![CDATA[ 
<p>Lorem ipsum dolor sit amet, consectetur adipiscing elit. Duis nec ullamcorper massa. Fusce in nibh nulla, id viverra mi. Aliquam consectetur, nisl eget mattis porta, lorem felis lacinia orci, non malesuada lacus nibh sed dui. Praesent blandit erat id tortor fringilla commodo suscipit urna ultricies. Proin facilisis rutrum ligula ac venenatis.</p> 
<div id="attachment_2255" class="wp-caption alignnone"><img src="http://myBlog.files.wordpress.com/2011/10/image.jpg?w=400&#038;h=222" alt="Image" class="size-full wp-image-2255" /><p class="wp-caption-text">Lorem ipsum dolor sit amet, consectetur adipiscing elit.</p></div> 
<p>Lorem ipsum dolor sit amet, consectetur adipiscing elit. Duis nec ullamcorper massa. Fusce in nibh nulla, id viverra mi. Aliquam consectetur, nisl eget mattis porta, lorem felis lacinia orci, non malesuada lacus nibh sed dui. Praesent blandit erat id tortor fringilla commodo suscipit urna ultricies. Proin facilisis rutrum ligula ac venenatis.</p>]]> 
+1

請提供輸入信息,以便我們爲您提供幫助。我不知道rss的cdata部分是什麼樣的。 – FailedDev

+0

你正在走下一條非常危險的道路。一般來說,用正則表達式解析XML是不可能的。你可以解析*特定的東西,但正如你所看到的,即使這個簡單的例子,你也必須考慮奇怪的編碼規則。使用HTML解析器執行此操作會更好。請參閱http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454。 –

回答

1

沒有測試,但是這將是我第一次嘗試......

\?w=[0-9]+&h=[0-9]+ 

編輯:編輯後,我看到輸入數據已經改變。礦山的答案是基於找到一個匹配?W = 400 & H = 222

&#038;是一個符號的轉義序列。如果第一個不起作用,請嘗試以下操作...

\?w=[0-9]+&#038;h=[0-9]+