我有以下數據框中選擇一個子集:使用dropna()選擇多列
df = pd.DataFrame([[1,2,3,3],[10,20,2,],[10,2,5,],[1,3],[2]],columns = ['a','b','c','d'])
從這個數據幀,我要刪除的行,其中在子集[「B」,「C的所有值','d']是NA,這意味着最後一行應該被刪除。
下面的代碼工作:
df.dropna(subset=['b', 'c', 'd'], how = 'all')
然而,考慮到我將與較大的數據幀中的工作,我想選擇使用的範圍內「B」:「d」]相同的子集。我如何選擇這個子集?
@ayhan是,類似的東西,但我意識到':'可能導致昂貴的拷貝:-) –
@cᴏʟᴅsᴘᴇᴇᴅ是的,我一直在尋找到'columns.slice_locs'來避免這種情況,但是你的是一個很好的黑客。 :) – ayhan