2017-04-24 46 views
2

我有csv的另一個問題。我正在使用熊貓從csv文件中刪除重複項。這樣做後,我注意到所有的數據已被放入一列(預處理的數據已包含在9列)。如何避免這種情況?熊貓將一行中的所有數據放在一列

這裏是數據樣本:

39,43,197,311,112,88,47,36,Label_1 

下面是函數:

import pandas as pd 

def clear_duplicates(): 
    df = pd.read_csv("own_test.csv", sep="\n") 
    df.drop_duplicates(subset=None, inplace=True) 
    df.to_csv("own_test.csv", index=False) 

回答

4

刪除sep,因爲默認的分隔是,read_csv

def clear_duplicates(): 
    df = pd.read_csv("own_test.csv") 
    df.drop_duplicates(inplace=True) 
    df.to_csv("own_test.csv", index=False) 

也許不是那麼好,但也可以工作:

pd.read_csv("own_test.csv").drop_duplicates().to_csv("own_test.csv", index=False) 
+0

對我來說這看起來不錯。 – piRSquared

+0

@piRSquared - 謝謝。 – jezrael

+0

第二種選擇很好! – MaxU

相關問題