回答
你可以去星火MLlib算法。 Spark提供機器學習算法,該算法通過使用用戶,產品和評分進行訓練。在你的情況下,評級將是一件物品的購買次數(用戶購買一件物品的次數)。
您可以按照此處顯示的示例Collaborative filtering - ALS直接轉到ALS算法。
您可以使用Cos協方差和相關性。
https://github.com/Krewn/KPlot/blob/gh-pages/analysisTools.py
請您介紹一下嗎?或者Java代碼 –
在java中我可能會從這裏開始,http://commons.apache.org/proper/commons-math/javadocs/api-3.6.1/index.html – kpie
亨利馬烏已基於所述概率數似然比(LLR)的用戶和項目相似性,這已被證明相比於其他相似的度量,得到優異的性能,並且僅在名義上「相似性」,實際上是一種相關性測試。 Mahout中的LLR會爲每個檢測到的事件(數據集中的行)生成一個分數。該數據收集在spark-itemsimilarity
作業的「指示器」矩陣中。您可以將其與搜索引擎一起用於創建推薦人或使用我們爲PredictionIO創建的推薦人。
PredictionIO是一個帶有數據庫,工作流控制以及存儲和計算引擎集成的機器學習服務器。請參閱Universal Recommender,它使用Spark上的Mahout,並且是一個功能齊全的端到端推薦器,可以查詢基於用戶的建議。
謝謝。我用對數似然比。但它忽略了購買記錄。我在考慮是否可以根據購買記錄改進推薦系統。因爲如果用戶多次購買商品,則可能表示用戶喜歡商品更多。 –
您可能會認爲,但我已經使用tanimoto進行了交叉驗證實驗,tanimoto是使用矢量長度(購買數量),餘弦(不使用長度但使用購買次數)和LLR節拍的主要相似性指標這兩方面都有很大的優勢。這是來自大型在線零售商的真實世界ecom購買數據。這是因爲購買數量往往不表示偏好,這表明產品像現在一樣持久(除臭劑和紅牛的罐頭;-)。 – pferrel
- 1. 如何根據文檔集合計算文檔相似度?
- 2. 如何計算jaccard相似度
- 3. 計算餘弦相似度
- 4. 計數相似的記錄
- 5. SQL計數相似記錄
- 6. 根據記錄類型計算總和
- 7. Google Play購買記錄
- 8. 如何計算多類型數據的餘弦相似度?
- 9. 如何計算來自熊貓數據幀的jaccard相似度
- 10. 根據請求記錄計算打印的計算器
- 11. 如何根據信用記錄計算信用評分
- 12. 如何根據特定值計算組記錄?
- 13. 如何根據計算對記錄進行排序Rails
- 14. iPhone - 應用程序內購買:記錄購買
- 15. LibGdx:無需購買即可加載購買記錄()
- 16. 句子相似度 - 如何使用WordNet計算subsumer的深度?
- 17. 方法來計算相似度
- 18. 計算稀疏矩陣的相似度
- 19. 計算NSStrings中的相似度
- 20. python中的wordnet相似度計算
- 21. 計算權重的相似度得分
- 22. 計算加權樹的相似度
- 23. 計算mahout中的餘弦相似度
- 24. 計算兩個列表的相似度
- 25. 使用Python計算餘弦相似度
- 26. 計算餘弦相似度,如果數據包含NA值
- 27. 如何根據這些標準訂購數據庫記錄?
- 28. DataFrame計算平均購買價格
- 29. 如何使用對數似然度量與數學公式計算相似度?
- 30. 根據類似的值計算行數
非常感謝。我會去嘗試一下。 –