我有這樣的數據幀:排名在多個列熊貓
dict_data = {'id' : [1,1,1,2,2,2,2,2],
'datetime' : np.array(['2016-01-03T16:05:52.000000000', '2016-01-03T16:05:52.000000000',
'2016-01-03T16:05:52.000000000', '2016-01-27T15:45:20.000000000',
'2016-01-27T15:45:20.000000000', '2016-11-27T15:08:04.000000000',
'2016-11-27T15:08:04.000000000', '2016-11-27T15:08:04.000000000'], dtype='datetime64[ns]')}
df_data=pd.DataFrame(dict_data)
的數據看起來像這樣
我想排名在客戶ID和日期,我用這個代碼
(df_data.assign(rn=df_data.sort_values(['datetime'], ascending=True)
....: .groupby(['datetime','id'])
....: .cumcount() + 1)
....: .sort_values(['datetime','rn'])
....:)
我通過每個日期的ID得到不同的等級:
我想看到的是ID列,但對於同一日期時間獲取每個ID同一職級。
排名的詳細信息的方法也許提供了一個實際的佈局你想要的輸出? :)不知道我完全得到它! – Roelant
並添加進口熊貓作爲PD,作爲NP進口numpy也會有所幫助:) – Roelant