以下是數據框的子集。刪除一行中的所有重複值,同時保持該行使用熊貓(python)
我想刪除每行中的所有重複的項目。例如,第一行的最後一個值,頭暈,應除去,因爲頭暈已經在列WD2存在的行的1
我知道如何刪除在列中重複,但我不知道如何連續做。提前致謝。
以下是數據框的子集。刪除一行中的所有重複值,同時保持該行使用熊貓(python)
我想刪除每行中的所有重複的項目。例如,第一行的最後一個值,頭暈,應除去,因爲頭暈已經在列WD2存在的行的1
我知道如何刪除在列中重複,但我不知道如何連續做。提前致謝。
只需指定其他軸:
df = df.apply(lambda x:x.drop_duplicates(), axis=1)
import numpy as np
import pandas as pd
df = pd.DataFrame([
['a', 'b', 'c', np.nan],
['a', 'b', 'b', 'a'],
['c', 'b', 'c', 'd']
])
duplicated = df.apply(lambda x: x.duplicated(keep='first'), axis=1) # converts each row into a pd.Series of True/False values indicating whether a cell is a duplicate
print(duplicated) # this is a pd.DataFrame of True/False indicating which cells to drop.
df[duplicated] = np.nan # assign np.nan to duplicates
謝謝。這是一個很好的答案。 – Mary