2013-01-14 73 views
1

我正在閱讀元素包含html標籤時有時會損壞的新聞提要。 它拋出此異常:從RSS提要元素中刪除Html標籤

[意外的節點類型元素。 ReadElementString方法只能 呼籲用簡單或空內容元素]

XML樣品

<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"> 
    <channel> 
    <title>test xml feed</title> 
    <atom:link href="http://www.newssite.com" rel="self" type="application/rss+xml"/> 
    <description>test</description> 
    <item> 
     <title> 
     Title followed by html tags 
     <br/> 
     </title> 
     <link> 
     http://www.newssite.com 
     </link> 
     <description> 
     Description Data 
     </description> 
     <pubDate>Mon, 14 Jan 2013 21:20:00 +0400</pubDate> 
     <category>Cat1</category> 
    </item> 
    </channel> 
</rss> 

代碼示例

static void Main(string[] args) 
     { 
      XmlReader reader = new XmlTextReader(@"d:\test.xml"); 
      SyndicationFeed feed = SyndicationFeed.Load(reader); 
     } 
    }  

我想這Answer爲另一個XML日期格式問題,它是完美的工作。 當我使用它解決html標記它不起作用,仍然拋出異常。

回答

0

解析與HTML敏捷性包

飼料CodePlex上:http://htmlagilitypack.codeplex.com/

+0

HAP讀取只有文件系統的文件。我需要通過互聯網閱讀XML。 – user968159

+0

如果您看看名爲StackOveflow @ http://htmlagilitypack.codeplex.com/SourceControl/changeset/view/99964#1096647的測試。它從webrequest中讀取... – lboshuizen