1
我旁邊大熊貓數據幀DF:評級正常化
user item rating
1 1 1
1 2 1
1 3 3
2 1 2
2 2 2
2 3 1
...
我想正常化等級,定義在0和1的方法之間等級的所有值都非常簡單,只需通過劃分一些用戶的每一個值這個用戶的最大值。
我已經創建了下面的代碼:
ratingNormalised = []
for user in df['user'].unique:
dfUser = df[df['user'] == user]
userNormalised = (dfUser['rating']/max(dfUser['rating'])).tolist()
ratingNormalised.extend(userNormalised)
df['ratingNorm'] = Series(ratingNormalised, index=df.index)
是否有可能找到一些更好的解決方案,這可能是更Python?
再次感謝你,需要使用lambda函數。 – Guforu 2014-10-28 09:14:22