2013-10-12 69 views
0

我從用戶獲得一個URL到網頁或站點地圖。C#檢測給定的URL的類型

什麼是最簡單的方法來檢查給定的URL的類型(站點地圖或網頁)?

謝謝!

+0

大多數(或所有?)站點地圖都基於XML,所以我會檢查站點是否只包含XML。 –

+0

你期望站點地圖,而不是一個網頁的URL看起來像?你試過什麼了?你是否認爲你必須檢查內容?是否有定義的網站地圖文件標準?你有沒有考慮過如何解析這些? –

+0

@丹尼爾「大部分」似乎不是一種確定類型的非常可靠的方法。 –

回答

0

已經要求澄清的問題,這裏是你需要做什麼:

  1. 檢查URL是否有效,並獲取內容。
  2. 根據基於XML的站點地圖規範http://www.sitemaps.org/protocol.html驗證內容。這可以通過定義映射到urlset和url的類並通過將XML反序列化爲這些類型來完成。
  3. 如果它是有效的XML,則將其視爲網站地圖。
  4. 如果XML無效,您可能希望警告用戶,或者將其視爲網頁。
  5. 如果不是XML,您可以將其視爲網頁。