我正在開發一個微型論壇,通過一個特殊的用戶發佈一個快速(接近推特大小)的主題消息,這些訂閱者可以用他們自己的大小的消息做出響應。直截了當,不要對任何形式進行「挖掘」或投票,只是按時間順序對每個主題消息進行回覆。但預計流量很高。趨勢算法
我們希望標誌根據他們atract響應議話題的消息,使用0分至10
被google搜索趨勢算法和開源社區的應用實例一會兒,到目前爲止有收集到的兩個有趣的參考,我不完全神交尚未:
Understanding algorithms for measuring trends,比較上使用Baseline趨勢算法,這裏SO維基百科瀏覽量討論。
The Britney Spears Problem,這是一篇關於如何在處理大量數據流時對搜索項進行排名的深度文章。
從第一個我明白需要檢查活動的斜率,並平衡活動規模差異很大的兩個項目之間的重量。但是,我如何比較很多項目,隨着時間的推移快速增長?然後,如何將「buzz成績」中的項目從0分到10分?
第二個參考是令人着迷的,但在這一點上我的頭。從第一遍我已經理解需要保持內存使用的穩定性,同時保留計數器並在必要時存儲對項目的引用。但是,我還沒有爲我的特定用例計算出合適的算法。
值得注意的是,我來自非計算機科學,絕對不是統計背景。請耐心等待:)任何幫助和代碼示例(特別是在Ruby中)將不勝感激。
更新:剛剛轉發這個偉大的文章[如何建立一個熱門的算法,你可以自豪](http://blog.linkibol.com/2010/05/07/how-to-build-a -popularity-algorithm-you-can-be-proud-of /) – oliverbarnes 2011-01-13 21:04:08
@Joe Doyle:感謝您幫助[清理](http://meta.stackexchange.com/questions/128315/the-great-stack- overflow-tag-question-cleanup-of-2012),但這不是[tag:trends]的合法用法嗎? – 2012-04-30 03:17:21