2010-11-01 68 views
2

假設我想分析Sherdog新聞提要。是通過解析公共XML文件來檢索它們的唯一方法嗎?網站是否沒有將服務內容「推送」到服務器上?網站如何從rss提要中檢索「新」項目?

我在這個印象之下,做這件事的常見方法是設置一個cron作業,說每10分鐘打一個頁面(如this),並且將項目插入數據庫(如果它們不在那裏)。

這是這種情況?如果沒有,有人可以教育我嗎?

回答

2

是的,輪詢RSS饋送是事實上的標準。 RSS閱讀器和服務器應該支持緩存機制(最重要的是HTTP條件GET)來提高效率。

擺脫投票的新興方法是PubSubHubub,它確實將通知推送給訂閱者。

+0

得到任何鏈接輪詢RSS源的最佳做法? – Martin 2010-11-01 04:25:01

+0

PubSubHubbub將節省您的帶寬...和您的CPU週期:)另外,請檢查http://superfeedr.com,因爲它們可以將_any_提要轉換爲PubSubHubbub,因此您不必輪詢任何提要。 – 2010-11-01 08:28:00

+0

@Julien Genestoux - 您是否認爲PubSubHubub現在可以使用,這要歸功於superfeedr?你自己用它嗎? – 2010-11-01 15:38:10