0
在熊貓中,如何對同組列的值進行編號/排序?例如:熊貓編號/排序相同列值的集合
Col1 Col2
Andy 1
Chad 1
Bill 1
Andy 2
Bill 2
Bill 3
Chad 2
比爾4 由於安迪得到2個值,我想1和2號,在塔2爲比爾,我要一些IT 1,2,3和4等。
在熊貓中,如何對同組列的值進行編號/排序?例如:熊貓編號/排序相同列值的集合
Col1 Col2
Andy 1
Chad 1
Bill 1
Andy 2
Bill 2
Bill 3
Chad 2
比爾4 由於安迪得到2個值,我想1和2號,在塔2爲比爾,我要一些IT 1,2,3和4等。
如果我理解正確,你想要在Col2
,這將是簡單的名稱的累計數;
df['Col2'] = df.groupby('Col1').cumcount()+1
樣本;
Col1
0 Andy
1 Chad
2 Bill
3 Andy
4 Bill
5 Bill
6 Chad
7 Bill
df['Col2'] = df.groupby('Col1').cumcount()+1
Col1 Col2
0 Andy 1
1 Chad 1
2 Bill 1
3 Andy 2
4 Bill 1
5 Bill 2
6 Chad 2
7 Bill 3
謝謝。我的問題是,在我的數據集中,唯一名稱的總數是1千6百萬,所以Group by非常慢。您是否有任何建議來加速此過程? –
我嘗試:DEF FUNC(X):X = x.append(rannge(LEN(X))df.groupby( 'Col1中')應用(FUNC),它是對大數據集超慢。 –