我有一個數據幀,看起來像這樣同樣的觀察在多個列
ID1 ID2 variables
a b something
b g something
c h something
d i something
a h something
如果一個ID顯示了在兩個ID1和ID2我希望從數據集排除ID1這個值的觀察。 因此,在這種情況下
ID1 ID2 variables
a b something
c h something
d i something
a h something
我認爲:
可以有相同ID的多次觀測。重命名,連接和刪除重複項將不起作用。
數據集相當大(數百萬觀察值),因此每個值的循環都不是一個選項。