0
我有一個熊貓數據框,我想填寫一些NaN值。基於MultiIndex Pandas填充NaN
import pandas as pd
tuples = [('a', 1990),('a', 1994),('a',1996),('b',1992),('b',1997),('c',2001)]
index = pd.MultiIndex.from_tuples(tuples, names = ['Type', 'Year'])
vals = ['NaN','NaN','SomeName','NaN','SomeOtherName','SomeThirdName']
df = pd.DataFrame(vals, index=index)
print(df)
0
Type Year
a 1990 NaN
1994 NaN
1996 SomeName
b 1992 NaN
1997 SomeOtherName
c 2001 SomeThirdName
,我想輸出是:
Type Year
a 1990 SomeName
1994 SomeName
1996 SomeName
b 1992 SomeOtherName
1997 SomeOtherName
c 2001 SomeThirdName
這需要在一個更大的數據幀(百萬行)完成,其中每個「類型」可以1-5之間唯一擁有'年「,名稱價值只出現在最近一年。爲了性能目的,我試圖避免迭代行。
或者直接'.bfill()'? :) – ayhan
@ayhan正是這裏需要的一個。 – Psidom