如何可以通過np.nan
在數據幀使用以下條件替代特定的值:如果一個列的值被重複在任何後續列,比第一次出現應用np.nan
代替。如何濾除列(每行)重複值
例如,
VD_1 VD_2 VD_3 VD_4
Test Sun Test None
Sun Sun Fun Fun
Big Sand Fun Big
的結果會是這樣:
VD _1 VD_2 VD_3 VD_4
None Sun Test None
None Sun None Fun
None Sand Fun Big
我應該使用drop_duplicates
和keep
等於last
?
因此,它可能有少列?您可能需要一個新的DataFrame,而不是「替換」這些值。 –
@XinHuang:是的,也可能是與無相同數量的列。查看我的更新。 – Dinosaurius
@XinHuang:請參閱我的更新。我稍微簡化了它。 – Dinosaurius