我無法想象它爲每票投票編制索引。它會不恰當地壓縮服務器。您認爲Reddit如何處理重新編排帖子以保持準確?
我提到這一點是因爲我試圖在我的項目上做類似的事情,並且無法弄清楚在投票之後索引對象的最佳方法。
我正在使用Sunspot-Solr。
我無法想象它爲每票投票編制索引。它會不恰當地壓縮服務器。您認爲Reddit如何處理重新編排帖子以保持準確?
我提到這一點是因爲我試圖在我的項目上做類似的事情,並且無法弄清楚在投票之後索引對象的最佳方法。
我正在使用Sunspot-Solr。
那麼,我不能肯定地說,但他們是一個開源項目。 http://code.reddit.com/
我知道我遲到了,但今天reddit修復了他們的搜索方式,爲您的問題帶來了新的亮點。答案是像Solr這樣的搜索引擎不能處理像reddit投票那樣的頻繁更新。他們現在使用IndexTank,它絕對有效! (是的,我是IndexTank的開發人員)
我認爲如果您想通過投票計數來影響搜索結果,您可以,但您需要以離線/延遲方式進行。我認爲你的投票對搜索結果影響的「實時」越少,那麼Solr就會越好,所以Reddit是一個糟糕的用例。只需每6或12或24小時更新一次投票,並只對已投票的文件子集進行更新。在某些時候,您將只能更新Solr文檔的一部分,這將有所幫助!
其實他們索引每次投票一次。
我們設計了新的搜索(使用IndexTank),每次更改時都會更新upvotes/downvotes/user karma。
indextank的好處在於,它允許您更新影響計分系統的文檔變量(數字),而不必重新索引文本數據。這使得即使有大量的(文檔變量)更新,索引也能保持快速。
我也讀過它! – Trip 2010-07-22 13:26:53
jhandl,三個答案,全部三個鏈接到indextank。認爲人們不會注意到這一點? :s – dmp 2010-08-14 23:23:28
你說得對,我應該添加一個免責聲明。完成。 – jhandl 2010-08-15 04:31:36