2015-12-29 68 views
-1

我正在尋找可以幫助我爲現有數據庫推薦最佳匹配記錄的解決方案。我考慮使用機器學習來完成這項任務。基於參數的推薦最佳機器學習解決方案

我有一組數據,它描述了電影的用戶選擇: 電影,年齡,性別,MOVIE_RATING(0-10)(在未來會有更多的參數)

話,我會想什麼get是一種解決方案,可幫助我通過參數找到最佳影片推薦。所以輸入將與用戶: 20歲,男性,電影評級8 +

而我的結果我想收到這個參數最佳匹配的電影。

我正在考慮決策森林迴歸,但也許有其他方法可以做到這一點。

回答

0

這樣做的一種方法是使用matrix factorization來查找矩陣的缺失值。對於你的問題,很多用戶不會對數據庫中的很多電影進行電影評級。因此,您可以使用矩陣分解來填充(近似)矩陣,然後根據給予不同電影的分數向用戶推薦電影。

0

爲了方便,只需使用樸素貝葉斯。它會讓你在測試中獲得80%以上的準確性,對於電影推薦等內容來說,它不可能100%準確地測試。

3

對於您的問題,沒有直接的算法,因爲您添加了多個功能,如年齡,性別,評分等。爲了實現您的目標,您可以使用多個低秩矩陣分解算法,如SVD或ALS來找到丟失(協作過濾)。然後,您需要應用分類算法對年齡(20歲以上),性別(男性)的8 +評級電影進行分類,並取其交叉點。