我有一個數據幀pandas
看起來像如何測量熊貓羣組中對象的重疊?
example_df = pd.DataFrame({"class": ["A", "A", "A", "B", "B", "B"], "id": [1,2,3,4,5,6], "value": [100, 100, 101, 101, 102, 103]})
example_df
class id value
0 A 1 100
1 A 2 100
2 A 3 101
3 B 4 101
4 B 5 102
5 B 6 103
我想知道,每個class
A或B,怎樣獨特的value
s爲;也就是說,它與另一個類共享多少個值。 (您可以假設只有兩個類。)例如,給定上面的數據框,A與B
共享一個值。
通過將列拆分爲set
s並手動計算交點來完成此操作並不困難,但這不是很好。在熊貓中有沒有一種優雅的方式呢?