0
我們假設用戶投票選出一些電影,比例爲1到5.這些電影有類型信息,而電影可以有多個類型。像這樣:尋找評分值爲最喜歡的用戶的項目
Movie A Rating 4
Action/Sci-Fi
Movie B Rating 5
Comedy/Action
Movie C Rating 4
Comedy/Drama
我們想要了解哪種流派喜歡我們的用戶。在這裏,我們有我們的結果集:
Genre Movie_Count Average_Rating
----------
Action 2 5
Comedy 2 4.5
SciFi 1 4
Drama 1 4
顯然,我們不能用這麼小的結果集預測什麼,但讓我們假設,我們已經一個更大的數據集。
使用此項的數據,我們如何排列這個使用者中最偏好的類型?簡單地計算加權平均或更復雜的東西?