2016-12-25 57 views
2

我想在熊貓中使用dropna函數。我想將它用於特定的列。在特定列(大熊貓)第一次出現NaN之後放下所有行

我只能弄清楚如何使用它來刪除NaN,如果所有行都有所有NaN值。

我有一個數據幀(見下文),我想的楠第一次出現後砸在特定列,列中的所有行「A」

當前的代碼,只有工作,如果所有的行值是NaN。

data.dropna(axis = 0, how = 'all') 
data 

原始數據幀

data = pd.DataFrame({"A": (1,2,3,4,5,6,7,"NaN","NaN","NaN"),"B": (1,2,3,4,5,6,7,"NaN","9","10"),"C": range(10)}) 
    data 


    A B C 
0 1 1 0 
1 2 2 1 
2 3 3 2 
3 4 4 3 
4 5 5 4 
5 6 6 5 
6 7 7 6 
7 NaN NaN 7 
8 NaN 9 8 
9 NaN 10 9 

我想什麼輸出看起來像:

A B C 
0 1 1 0 
1 2 2 1 
2 3 3 2 
3 4 4 3 
4 5 5 4 
5 6 6 5 
6 7 7 6 

任何幫助表示讚賞。 很顯然,我希望以最清潔最有效的方式來做到這一點。

謝謝!

回答

5

iloc使用+ argmax

data.iloc[:data.A.isnull().values.argmax()] 

    A B C 
0 1.0 1 0 
1 2.0 2 1 
2 3.0 3 2 
3 4.0 4 3 
4 5.0 5 4 
5 6.0 6 5 
6 7.0 7 6 

或具有不同的語法

top_data = data[:data['A'].isnull().argmax()] 
+0

@MaxU差不多,依賴於指數爲很好地有序整數。我以另一種方式修復它。 – piRSquared

+0

你能在這裏更快嗎? http://stackoverflow.com/questions/41318942/mask-out-specific-values-from-an-array – MYGz

+0

loc + idxmax有什麼問題?另外我認爲你不需要'.values','Series'也有'argmax'方法。 – ayhan