我有一個數據框有兩列,A
和B
。在這種情況下,A
和B
的順序並不重要;例如,我會認爲(0,50)
和(50,0)
是重複的。在熊貓中,從數據框中刪除這些重複項的有效方法是什麼?熊貓:從數據框中刪除相反的副本
import pandas as pd
# Initial data frame.
data = pd.DataFrame({'A': [0, 10, 11, 21, 22, 35, 5, 50],
'B': [50, 22, 35, 5, 10, 11, 21, 0]})
data
A B
0 0 50
1 10 22
2 11 35
3 21 5
4 22 10
5 35 11
6 5 21
7 50 0
# Desired output with "duplicates" removed.
data2 = pd.DataFrame({'A': [0, 5, 10, 11],
'B': [50, 21, 22, 35]})
data2
A B
0 0 50
1 5 21
2 10 22
3 11 35
理想情況下,輸出將按列A
的值排序。
不需要lambda,'.apply(sorted,axis = 1)'將會工作。 – root
@root。那就對了。一個更好的選擇。 – Psidom
我喜歡這個答案!我想過的每件事都包含堆疊到數據框。這聰明消除了這種需要。 – piRSquared