我用下面的代碼使用熊貓read_csv
熊貓:處理缺失列
headers = ["1","2","3","4","5"]
fields = ["1", "5"]
for chunk in pandas.read_csv(fileName, names=headers, header=0, usecols=fields, chunksize=chunkSize):
有時我的CSV不會有列「5」讀取數據塊的CSV文件,我希望能夠處理這種情況並指定一些默認值。有沒有辦法只讀取我的CSV文件的標題而不讀取整個文件,以便我可以手動處理?或者可能是其他聰明的方式來默認缺失列的值?
可能集'error_bad_lines = FALSE'。 –
@cᴏʟᴅsᴘᴇᴇᴅ事情是我需要爲每行的列「5」的值,但有時整個列「5」將丟失,所以我必須回退到默認值。 error_bad_lines = False會忽略該行,不是? –
是的,你是對的。不知道這個。我一直認爲熊貓會默認填充NaN。 –