2013-07-15 15 views
0

我正在使用Argotic Syndication Framework解析一個rss-feed到feed項目。不過,我需要去除所有html的描述。我使用<code>Argotic Syndication Framework</code>來解析一個rss-feed到feed項目中的c#strip rss描述爲使用Argotic整合框架的html

下面顯示了rss提要描述的示例。

Jeg blev i maj inviteret til at holde et oplæg som keynote speaker på en konference i Alaska i HETL-regi (The International Higher Education Teaching and Learning Association). Patrick Blessinger, stifteren af HETL, har netop medvirket i et amerikansk online radio &#8230; <a href="http://aesbrock.wordpress.com/2013/07/12/niels-brock-naevnt-i-amerikansk-radio-interview/">Læs resten <span class="meta-nav">&#8594;</span></a><img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=aesbrock.wordpress.com&#038;blog=978571&#038;post=4538&#038;subd=aesbrock&#038;ref=&#038;feed=1" width="1" height="1" /> 

我希望它只是顯示爲不帶html的文本。

我試着用下面的正則表達式

Regex.Replace(item.Description, @"<(.|\n)*?>", string.Empty); 

但是這是不完全正確;

我看到了關於使用HTMLAgilityPack的建議,但我想避免使用外部庫。

任何建議,非常感謝。

+0

這個怎麼樣:'Regex.Replace(item.Description,「<.*?>」,string.Empty);' – Pete

回答

0

感謝Pete的建議,但它仍然留下了一些html。我結束了這樣做。

HttpUtility.HtmlDecode(Regex.Replace(item.Description, @"<!--[\S\s]*?-->|<(?:"".*?""|'.*?'|[\S\s])*?>", "")); 

其從後(在webz地方),但我沒有書籤,所以如果有人認識到它 - 謝謝:)我希望它可以幫助別人。