2016-04-27 53 views
0

在熊貓中,如何對同組列的值進行編號/排序?例如:熊貓編號/排序相同列值的集合

Col1 Col2 
Andy 1 
Chad 1 
Bill 1 
Andy 2 
Bill 2 
Bill 3 
Chad 2 

比爾4 由於安迪得到2個值,我想1和2號,在塔2爲比爾,我要一些IT 1,2,3和4等。

+0

我嘗試:DEF FUNC(X):X = x.append(rannge(LEN(X))df.groupby( 'Col1中')應用(FUNC),它是對大數據集超慢。 –

回答

1

如果我理解正確,你想要在Col2,這將是簡單的名稱的累計數;

df['Col2'] = df.groupby('Col1').cumcount()+1 

樣本;

Col1 
0 Andy 
1 Chad 
2 Bill 
3 Andy 
4 Bill 
5 Bill 
6 Chad 
7 Bill 

df['Col2'] = df.groupby('Col1').cumcount()+1 

    Col1 Col2 
0 Andy  1 
1 Chad  1 
2 Bill  1 
3 Andy  2 
4 Bill  1 
5 Bill  2 
6 Chad  2 
7 Bill  3 
+0

謝謝。我的問題是,在我的數據集中,唯一名稱的總數是1千6百萬,所以Group by非常慢。您是否有任何建議來加速此過程? –