1
我從我的博客拉動rss提要,但是我希望刪除wordpress添加到我的圖像末尾的查詢字符串。正則表達式刪除/替換查詢字符串RSS提要內容塊
到目前爲止,我嘗試了一些正則表達式,但到目前爲止還沒有能夠拿出一個從rss提要的cdata部分的內容塊中刪除?w=400&h=222
。
任何想法傢伙?
感謝
[編輯]
飼料的CDATA部分看起來是這樣的:
<![CDATA[
<p>Lorem ipsum dolor sit amet, consectetur adipiscing elit. Duis nec ullamcorper massa. Fusce in nibh nulla, id viverra mi. Aliquam consectetur, nisl eget mattis porta, lorem felis lacinia orci, non malesuada lacus nibh sed dui. Praesent blandit erat id tortor fringilla commodo suscipit urna ultricies. Proin facilisis rutrum ligula ac venenatis.</p>
<div id="attachment_2255" class="wp-caption alignnone"><img src="http://myBlog.files.wordpress.com/2011/10/image.jpg?w=400&h=222" alt="Image" class="size-full wp-image-2255" /><p class="wp-caption-text">Lorem ipsum dolor sit amet, consectetur adipiscing elit.</p></div>
<p>Lorem ipsum dolor sit amet, consectetur adipiscing elit. Duis nec ullamcorper massa. Fusce in nibh nulla, id viverra mi. Aliquam consectetur, nisl eget mattis porta, lorem felis lacinia orci, non malesuada lacus nibh sed dui. Praesent blandit erat id tortor fringilla commodo suscipit urna ultricies. Proin facilisis rutrum ligula ac venenatis.</p>]]>
請提供輸入信息,以便我們爲您提供幫助。我不知道rss的cdata部分是什麼樣的。 – FailedDev
你正在走下一條非常危險的道路。一般來說,用正則表達式解析XML是不可能的。你可以解析*特定的東西,但正如你所看到的,即使這個簡單的例子,你也必須考慮奇怪的編碼規則。使用HTML解析器執行此操作會更好。請參閱http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454。 –