我想讀取與numpy.genfromtxt
的csv文件,但某些字段是包含逗號的字符串。字符串用引號引起來,但numpy不能將引號識別爲定義單個字符串。例如,在 't.csv' 中的數據:使用numpy.genfromtxt讀取包含逗號的字符串的csv文件
2012, "Louisville KY", 3.5
2011, "Lexington, KY", 4.0
代碼
np.genfromtxt('t.csv', delimiter=',')
產生錯誤:
ValueError: Some errors were detected ! Line #2 (got 4 columns instead of 3)
的數據結構我尋找是:
array([['2012', 'Louisville KY', '3.5'],
['2011', 'Lexington, KY', '4.0']],
dtype='|S13')
查看文檔,我沒有看到任何處理這個問題的方案。有沒有辦法做到numpy,還是我只需要用csv
模塊讀取數據,然後將其轉換爲numpy數組?
您可以發佈更完整的CSV,我想我知道如何解決你的問題;) –
您應該改變您的CSV從'替換分隔符,''來;'例如... –
@SaulloCastro:我不能這樣做,因爲我的真實數據非常混亂,並且帶有';'和/或任何其他可以想到的角色的字符串 - 這僅僅是一個玩具的例子。我正在尋找的是更通用的解決方案。 – CraigO