在一個jupyter筆記本中,我有一個從不同的合併數據集創建的數據框。Python /熊貓:樞軸表
record_id | song_id | user_id | number_times_listened
0 |ABC | Shjkn4987 | 3
1 |ABC | Dsfds2347 | 15
2 |ABC | Fkjhh9849 | 7
3 |XYZ | Shjkn4987 | 20
4 |XXX | Shjkn4987 | 5
5 |XXX | Swjdh0980 | 1
我想創建由song_id透視表數據框中列出user_ids的數量和number_times_listened總和。
我知道我需要用count和sum函數創建一個for循環,但是我不能讓它工作。我也嘗試了熊貓模塊的pd.pivot_table。
df = pd.pivot_table(data, index='song_ID', columns='userID', values='number_times_listened', aggfunc='sum')
或者類似的東西?
total_user=[]
total_times_listened =[]
for x in data:
total_user.append(sum('user_id'))
total_times_listened.append(count('number_times_listened'))
return df('song_id','total_user','total_times_listened')
完美工作!謝謝! – jeangelj
對於我的機器學習模型,我需要有一個標題行 - 在這種情況下,我有3個。我一直試圖修復它在python中沒有成功。嘗試刪除2個標題行,並有一個行爲behavior_df.columns = ['song_id','play_count_sum','user_id_count'] – jeangelj