我在python中解析一個非常大的csv(大=幾十千兆字節)文件,我只需要每行的第一列的值。我寫了這個代碼,不知道是否有更好的方式來做到這一點:有效的方法來獲取字符串的一部分,直到標記
delimiter = ','
f = open('big.csv','r')
for line in f:
pos = line.find(delimiter)
id = int(line[0:pos])
有第一分隔符之前得到的字符串部分更有效的方式?
編輯:我知道關於CSV模塊(我偶爾會用到它),但我不需要在內存中加載每一行文件 - 我需要第一列。所以讓我們專注於字符串解析。
http://docs.python.org/2/library/csv.html –
是什麼樣的這個代碼你覺得不盡人意?它是否花了太長時間,使用太多內存,你是否以文體爲由反對它? – NPE
不,它可以正常工作,我對python還不是很有信心。 – ddinchev