1
我想建立一個推薦引擎,爲此,我正在考慮使用apache mahout,但我無法做出如果mahout實時處理數據,或者當服務器閒置並存儲時預處理數據結果在數據庫的某處。mahout是否可以實時工作或者是否根據算法規則預處理數據?
也沒有人有任何想法什麼辦法做網站像亞馬遜,netflix後續?
我想建立一個推薦引擎,爲此,我正在考慮使用apache mahout,但我無法做出如果mahout實時處理數據,或者當服務器閒置並存儲時預處理數據結果在數據庫的某處。mahout是否可以實時工作或者是否根據算法規則預處理數據?
也沒有人有任何想法什麼辦法做網站像亞馬遜,netflix後續?
要麼/或,但不是兩者。一個較老的項目裏面有些部分基本上是適合中等規模的實時。也有基於Hadoop的實現都是離線的。這兩個不相關。
我這些零件的主要創造者,如果你想有一個系統,不能兩者一起,我建議你看看我的當前項目Myrrix(http://myrrix.com)
好了,所以你的意思是,我們可以處理數據實時或者可以預處理數據並在之後使用結果,但不能同時在mahout中使用。 P.S如果我們希望儘量減少顯示結果的時間,那麼最好的方法是什麼,空間不是問題。 –