2
我想刪除數據框中重複的相鄰行。我試圖用df[df.shift() != df].dropna().reset_index(drop=True)
來做到這一點,但shift()
沒有按照我的意思行事。pandas.shift如何真正起作用?
請看下面的例子
In [11]: df
Out[11]:
x y
0 a 1
1 b 2
2 b 2
3 e 4
4 e 5
5 f 6
6 g 7
7 h 8
df.x [3]等於df.x [4]但數字是不同的。雖然輸出如下:
In [13]: df[df.shift() != df]
Out[13]:
x y
0 a 1
1 b 2
2 NaN NaN
3 e 4
4 NaN 5
5 f 6
6 g 7
7 h 8
我想刪除行,如果他們真的重複,而不是如果他們包含一些重複值。任何想法?
謝謝!它的工作原理,我理解如何。 – Angelo