2013-06-02 169 views
1

有些網站可以得到全文RSS訂閱,當RSS地址沒有全文 喜歡這個網站This如何閱讀全文RSS訂閱

我該怎麼辦呢?

+0

你問如何篩選如果網站不提供RSS提要的刮? – Kane

+0

nope,我問如何rss rss只有摘要時的所有描述 –

回答

3

我對C#不太瞭解,但我仍然可以就如何解決您的問題提供一般性答案。 RSS提要(幾乎)始終鏈接到報紙/博客網站上的文章,文章全部可用。因此,「RSS填充程序」從網站內容中提取文章的內容,並基本放回到Feed中,替換可用(簡短)介紹。

要做到這一點,你需要:

  • 解析/生成RSS /原子飼料(我敢肯定有很多C#庫來做到這一點)
  • 找到從HTML頁面的實際物品鏈接在原來的RSS源中。事實上,鏈接頁面包含了許多您不想放在「完整」RSS訂閱源中的內容(例如網站標題,導航欄,廣告,評論,Facebook之類的按鈕等)。最簡單的方法是使用readability(快速谷歌檢查提供this lib)。

如果將兩者結合使用,則可以實現目標。

您可以在http://fivefilters.org找到這種工具的一個實現,它們的源代碼(用於舊版本)位於/ content-only/http://code.fivefilters.org/full-text-rss/。它在PHP中,但它可以給出如何繼續的粗略想法。

0

您可以從Full post rss feed網站 獲得放大部分rss訂閱源的完整腳本步驟涉及: - 從RSS訂閱源獲取發佈網址。
- 獲取帖子URL的完整內容,它將使用curl獲取內容。
- 解析內容,它使用模板。他們不斷更新最受歡迎的網站和WordPress主題的模板。根據模板,將html內容解析爲html dom對象,然後根據html dom對象找到內容。
- 最後,再次生成全部內容的RSS源。

您可以檢查用PHP編寫的腳本以獲得一些想法,稍後您可以將邏輯重寫爲任何語言。