2010-07-10 102 views
0

我正在構建新聞聚合網站,並且正在尋找將任何特定網站的舊訂閱源提取到系統中的方法。在這個過程中,我偶然發現了Feedjack。據說它處理我所需要的。於是我開始潛入源代碼。 (我不想在我的Django項目直接plugit)。我看到的是這一行:FeedJack如何獲取歷史訂閱源

self.fpf = parse_feed(self.feed.feed_url, agent=USER_AGENT, etag=self.feed.etag) # in bin/feedjack_update.py 

我不知道如何處理歷史飼料解析。我可以知道我錯過了什麼嗎?我還有一個問題,更別說feedjack了,我如何訪問任何網站的歷史提要?

回答

0

從網站不提供歷史訂閱源。不幸的是,「訪問」它的唯一方法是將它自己存儲在數據庫中。對於常見的Feed,您可能能夠從另一個聚合器獲取它。否則,您會從第一次添加訂閱源開始建立歷史記錄。

0

我能看到的唯一選擇是使用Google閱讀器。有一個blogpost about constructing feed history of any feed。我不想堅持只獲取歷史飼料的服務。無論如何,如果沒有更好的選擇,我會爲此而努力。

+0

我閱讀了上述谷歌閱讀器blogpost中的評論,並試用了NewsBlur.com。兩者似乎都以同樣的方式失敗,除非有人訂閱該網站已經至少一次,否則你不能保證舊的收費。所以谷歌閱讀器只是提取已經緩存的條目。如果沒有人訂閱了該網站,那麼它的緩存中就沒有任何內容,並且您無法從此Google閱讀器平臺中檢索它。遊戲結束! – 2010-07-21 02:33:54