鑑於以下數據幀:熊貓標籤重複
import pandas as pd
d=pd.DataFrame({'label':[1,2,2,2,3,4,4],
'values':[3,5,7,2,5,8,3]})
d
label values
0 1 3
1 2 5
2 2 7
3 2 2
4 3 5
5 4 8
6 4 3
我知道如何計算這樣的獨特的價值觀:
d['dup']=d.groupby('label')['label'].transform('count')
導致:
label values dup
0 1 3 1
1 2 5 3
2 2 7 3
3 2 2 3
4 3 5 1
5 4 8 2
6 4 3 2
但什麼我想是一列有以下值: 1
如果有如果存在duplicates
並且所討論的行是first
這樣的話,並且0
如果該行是原始的duplicate
,則每個標籤列爲1 unique
行,2
。像這樣:
label values dup status
0 1 3 1 1
1 2 5 3 2
2 2 7 3 0
3 2 2 3 0
4 3 5 1 1
5 4 8 2 2
6 4 3 2 0
在此先感謝!
我喜歡雙'where',你有我的一票:) – IanS
@IanS - 謝謝你。 ;) – jezrael
完美。謝謝! –