2016-11-07 22 views
0

我有一個谷歌新聞站點地圖源,但我不能反序列化xml的c#列表集合。我如何反序列化Google新聞網站地圖供稿c#

我想從我的源中獲得前50項。

我能做些什麼?任何想法 ?由於

我的XML樣本是這樣的:

<?xml version="1.0" encoding="UTF-8"?> 
<?xml-stylesheet type="text/xsl" href="http://www.hellenicshippingnews.com/wp-content/plugins/xml-sitemap-feed/includes/xsl/sitemap-news.xsl?ver=4.7.3"?> 
<!-- generated-on="2016-11-07T12:40:55+00:00" --> 
<!-- generator="XML & Google News Sitemap Feed plugin for WordPress" --> 
<!-- generator-url="http://status301.net/wordpress-plugins/xml-sitemap-feed/" --> 
<!-- generator-version="4.7.3" --> 
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" 
xmlns:news="http://www.google.com/schemas/sitemap-news/0.9" 
xmlns:image="http://www.google.com/schemas/sitemap-image/1.1" 
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 
    http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd 
    http://www.google.com/schemas/sitemap-news/0.9 
    http://www.google.com/schemas/sitemap-news/0.9/sitemap-news.xsd 
    http://www.google.com/schemas/sitemap-image/1.1 
    http://www.google.com/schemas/sitemap-image/1.1/sitemap-image.xsd"> 
<url> 
    <loc>http://www.hellenicshippingnews.com/odc-to-convert-fifth-greek-vessel-olympic-target/</loc> 
    <news:news> 
     <news:publication> 
      <news:name>Hellenic Shipping News Worldwide</news:name> 
      <news:language>en</news:language> 
     </news:publication> 
     <news:publication_date>2016-11-07T10:00:57+00:00</news:publication_date> 
     <news:title>ODC to convert fifth Greek vessel Olympic Target</news:title> 
     <news:keywords>Hellenic Shipping News, ΒunkerportsnewsΠρώτηΣελιδα, Πρώτη σελιδα</news:keywords> 
    </news:news> 
    <image:image> 
     <image:loc>http://www.hellenicshippingnews.com/wp-content/uploads/2015/10/double-hulled_oil_tanker.jpg</image:loc> 
     <image:title><![CDATA[double-hulled_oil_tanker]]></image:title> 
    </image:image> 
</url> 
</urlset> 

我嘗試使用本C#代碼,但什麼都沒有發生:

XDocument feedXML = XDocument.Load("http://www.hellenicshippingnews.com/sitemap-news.xml"); 

     var feeds = from feed in feedXML.Descendants("url") 
        select new 
        { 
         Title = feed.Element("loc").Value, 
         Link = feed.Element("news:title").Value, 
         Description = feed.Element("news:keywords").Value 
        }; 
+2

你是什麼意思*什麼都沒有發生*?請更具體地說。是否拋出運行時異常? LINQ會產生一個空的結果嗎? –

+0

找不到.descendants(「url」) –

回答

1

你忘記了命名空間(見那些xmlns屬性周圍urlset根元素)。

此外,你應該使用Descendants方法,而不是Element

見注下面的粗體:

每文檔,Element

獲取第一個(按文檔順序)子元素與指定的XName。

而且,Descendants

返回後代元素此文檔或元素的集合,按文檔順序。

子元素被認爲是父元素的直接內部節點。 titlekeywords不是url的子節點,因此您應該使用Descendants方法來深入搜索節點層次結構。

string ns = "http://www.sitemaps.org/schemas/sitemap/0.9"; 
string news_ns = "http://www.google.com/schemas/sitemap-news/0.9"; 
var feeds = from feed in feedXML.Descendants(String.Format("{{{0}}}{1}", ns, "url")) 
      select new 
      { 
       Title = feed.Element(String.Format("{{{0}}}{1}", ns, "loc")).Value, 
       Link = feed.Descendants(String.Format("{{{0}}}{1}", news_ns, "title")).Single().Value, 
       Description = feed.Descendants(String.Format("{{{0}}}{1}", news_ns, "keywords")).Single().Value 
      }; 
+0

哇!謝謝,我無法完全理解你的代碼,但它工作正常! 我怎樣才能得到和圖像:loc值? –

+0

@ G.Mich對於'publication_date',只需遵循'title'和'keywords'的相同模式。對於'image:title',你需要找到'http://www.google.com/schemas/sitemap-image/1.1'這樣的'image'命名空間**(看看'urlset'元素,你可以找到所有的名字空間)**。然後,您將遵循與'title'和'keyword'相同的模式,但是您會傳遞不同的名稱空間。你的情況,'image_ns'。 –

+0

謝謝男人!!!! –