如果其他另一行尊重某些條件，我該如何刪除行？

A B C D match? 
0 x y 1 1 true 
1 x y 1 2 false 
2 x y 2 1 false 
3 x y 2 2 true 
4 x y 3 4 false 
5 x y 5 6 false

我想放棄那些已經匹配別的地方不匹配的行。

A B C D match? 
1 x y 1 1 true 
3 x y 2 2 true 
4 x y 3 4 false 
5 x y 5 6 false

我該怎麼用熊貓呢？

2017-01-20 fast_cen

你可以讓自己的定位順序可以在整個總犯同樣的兩列進行排序。然後，通過在DF.drop_duplicates()方法中提供keep=False來刪除所有這樣的重複條目。

df[['C','D']] = np.sort(df[['C','D']].values) 
df.drop_duplicates(keep=False)

2017-01-20 14:48:33

這看起來確實可行，即使你必須小心，因爲「C」和「D」值可以交換（如果D大於C，這裏不是這種情況） –

是的，這就是爲什麼我必須在整理之前將它們整理一遍。 –

你可以用

df.C == df.D 

0  True 
1 False 
2 False 
3  True 
4 False 
dtype: bool

的比較兩列則一連降檔。

0  NaN 
1  True 
2 False 
3 False 
4  True 
dtype: object

每個True值表示新組的開始。我們可以使用cumsum創建我們需要爲groupby

(df.C == df.D).shift().fillna(False).cumsum() 

0 0 
1 1 
2 1 
3 1 
4 2 
dtype: int64

的分組然後使用groupy + last

df.groupby(df.C.eq(df.D).shift().fillna(False).cumsum()).last() 

    A B C D 
0 x y 1 1 
1 x y 2 2 
2 x y 3 4

2017-01-20 14:05:53 piRSquared

@MaxU做我的編輯澄清的問題？ – piRSquared

您的解決方案假定DataFrame值。 –

@fast_cen這是什麼假設？ – piRSquared

如果你想刪除其中「C」和「d」匹配的行中，方法.ix將幫助您：

df = df.ix[(df['C'] != df['D'])]

因此，df['C'] != df['D']產生布爾值的列表，並.ix允許你提取相應DataFrame :)

2017-01-20 14:45:22

回答