我有以下數據框:熊貓:第一轉換值組np.nan
df = pd.DataFrame({'series1':['A','A','A','A','B','B','B','C','C','C','C'],
'series2':[0,1,10,99,-9,9,0,10,20,10,10]})
series1 series2
0 A 0.0
1 A 1.0
2 A 10.0
3 A 99.0
4 B -9.0
5 B 9.0
6 B 0.0
7 C 10.0
8 C 20.0
9 C 10.0
10 C 10.0
我想要什麼:
df2 = pd.DataFrame({'series1':['A','A','A','A','B','B','B','C','C','C','C'],
'series2':[np.nan,1,10,99,np.nan,9,0,np.nan,20,10,10]})
series1 series2
0 A NaN
1 A 1.0
2 A 10.0
3 A 99.0
4 B NaN
5 B 9.0
6 B 0.0
7 C NaN
8 C 20.0
9 C 10.0
10 C 10.0
我有一種感覺,這也許能夠通過完成用熊貓.groupby功能:
df.groupby('series1').first()
series2
series1
A 0
B -9
C 10
這給我,我要轉換爲NaN的意見,但我想不出一種輕鬆地在原始DataFrame中替換它的方法。
這只是一個簡單的例子,我正在使用的實際數據幀具有> 8,000,000個觀察值。
!!!!!不錯的解決方案~~~ – Wen
@Wen謝謝! ^^ – Psidom