我正在構建新聞聚合網站,並且正在尋找將任何特定網站的舊訂閱源提取到系統中的方法。在這個過程中,我偶然發現了Feedjack。據說它處理我所需要的。於是我開始潛入源代碼。 (我不想在我的Django項目直接plugit)。我看到的是這一行:FeedJack如何獲取歷史訂閱源
self.fpf = parse_feed(self.feed.feed_url, agent=USER_AGENT, etag=self.feed.etag) # in bin/feedjack_update.py
我不知道如何處理歷史飼料解析。我可以知道我錯過了什麼嗎?我還有一個問題,更別說feedjack了,我如何訪問任何網站的歷史提要?
我閱讀了上述谷歌閱讀器blogpost中的評論,並試用了NewsBlur.com。兩者似乎都以同樣的方式失敗,除非有人訂閱該網站已經至少一次,否則你不能保證舊的收費。所以谷歌閱讀器只是提取已經緩存的條目。如果沒有人訂閱了該網站,那麼它的緩存中就沒有任何內容,並且您無法從此Google閱讀器平臺中檢索它。遊戲結束! – 2010-07-21 02:33:54