我認爲標題中的問題可以說明這一切,並且是一般性的。檢索前100行按函數排序而不計算表中的所有行?
我可以舉一個具體的例子還有:
我已標記的文章,並希望找到與之相關的標籤similar
文章。
得分函數將查看兩篇文章並計算共同標記的數量。
由於得分不存儲在任何地方,每當我需要找到類似的文章給出一篇文章時,我將不得不計算得分。
But this is too expensive.
- 什麼是常用的解決這類問題有什麼看法?
- 對我的具體
tag
問題有沒有更好的方法? (例如solr's moreLikeThis)
編輯
我使用Postgres的,如果該事項。
我要找的人成功地使用一個通用的解決方案,如you should batch calculate the score and save it somewhere
等..
如果計算起來昂貴,而且需要經常計算,批處理和緩存。 (也考慮增量更新,每次重新計算以確保準確性。) – Patashu