刪除一行中的所有重複值，同時保持該行使用熊貓（python）

以下是數據框的子集。刪除一行中的所有重複值，同時保持該行使用熊貓（python）

我想刪除每行中的所有重複的項目。例如，第一行的最後一個值，頭暈，應除去，因爲頭暈已經在列WD2存在的行的1

輸出應該是這樣的：

我知道如何刪除在列中重複，但我不知道如何連續做。提前致謝。

2017-01-27 Mary

只需指定其他軸：

df = df.apply(lambda x:x.drop_duplicates(), axis=1)

來源

2017-01-27 04:23:49 DyZ

謝謝。這是一個很好的答案。 – Mary

import numpy as np 
import pandas as pd 

df = pd.DataFrame([ 
    ['a', 'b', 'c', np.nan], 
    ['a', 'b', 'b', 'a'], 
    ['c', 'b', 'c', 'd'] 
]) 
duplicated = df.apply(lambda x: x.duplicated(keep='first'), axis=1) # converts each row into a pd.Series of True/False values indicating whether a cell is a duplicate 
print(duplicated) # this is a pd.DataFrame of True/False indicating which cells to drop. 
df[duplicated] = np.nan # assign np.nan to duplicates

來源

2017-01-27 04:17:58 bnj

謝謝。在應用函數之前，是否需要將數據幀轉換爲數組？如果是，如何？ – Mary

不，你可以直接應用這個df。無論如何，@ DYZ的答案是更好的，所以去吧。 – bnj

刪除一行中的所有重複值，同時保持該行使用熊貓（python）

回答

相關問題