2015-11-04 118 views
1

我不知道這是否可能。我試圖將12個文件追加到一個文件中。其中一個文件是製表符分隔的,其餘的逗號分隔。我將所有12個文件加載到數據框中,並將其附加到一個循環中的空白數據框中。如何更改分隔在逗號分隔的製表符

list_of_files = glob.glob('./*.txt') 
df = pd.DataFrame() 
for filename in list_of_files: 
    file = pd.read_csv(filename) 
    dfFilename = pd.DataFrame(file) 
    df = df.append(dfFilename, ignore_index=True) 

但是大文件不是我想要的格式。我認爲問題在於製表符分隔的文件。我試圖運行沒有製表符分隔文件的代碼,並且附加文件的格式很好。所以我在考慮是否可以將製表符分隔的格式更改爲使用熊貓分隔的逗號。

謝謝您的幫助和建議

回答

4

您需要告訴Pandas當您導入文件時,該文件是製表符分隔的。您可以將分隔符傳遞給read_csv方法,但在您的情況下,由於分隔符是按文件更改的,因此您希望傳遞無 - 這將使Pandas自動檢測正確的分隔符。

更改您的read_csv行:

pd.read_csv(filename,sep=None) 
+0

這是完美的。謝謝親愛的 – Same

1

這纔是製表符分隔的文件,你應該使用:

file = pd.read_csv(filename, sep="\t") 

熊貓read_csv有相當多的參數,檢查出來的docs