2017-02-02 102 views
1

我正在尋找有效的方式來刪除熊貓數據框中兩列之間的重複項。所以,我的數據是,熊貓刪除兩列之間的重複項

A B 
0 1 0 
1 1 1 
2 nan 2 
3 8 3 
4 7 7 

我想的是,

A B 
0 1 0 
1 nan 2 
2 8 3 

我怎樣才能得到這樣的輸出?謝謝!

回答

5

試試這個:

df = df[df.A != df.B] 

使用循環的要求:

dups_index = [] 
for i, row in df.iterrows(): 
    if row['A'] == row['B']: 
     dups_index.append(i) 
df = df[~df.index.isin(dups_index)] 
+0

它的工作原理,但我認爲,這不是有效的多。 :( – anniejcannon

+0

對不起,如果你找到更高效的方法,請告訴我:) –

+0

在循環中做這個可能不是更有效率。但我會將其添加到我的答案中。 –