我需要使用存儲在文件中的數據創建數據框。爲此,我想使用read_csv
方法。但是,分隔符不是很規則。某些列由製表符分隔(\t
),其他用空格分隔。此外,某些列可以由2或3或更多空格分隔,甚至可以由空格和製表符組合(例如3個空格,兩個製表符和1個空格)。如何使read_csv中的分隔符更加靈活wrt空格?
有沒有辦法讓大熊貓正確處理這些文件?
順便說一句,如果我使用Python,我沒有這個問題。我用:
for line in file(file_name):
fld = line.split()
它的作品完美。它不關心字段之間是否有2或3個空格。即使是空格和製表符的組合也不會導致任何問題。熊貓可以做同樣的事嗎?
你也可以使用'skipinitialspace'跳過初始空間 – jarondl 2014-12-04 14:28:00