我有一個大的文件(1.6演出)與分隔的列表:啜食/ CSV /環路中的文件創建數百萬有列行的字典
[||]
我曾嘗試使用csv模塊但它說我只能用一個字符作爲分隔符。所以這裏是我有:
fileHandle = open('test.txt', 'r', encoding="UTF-16")
thelist = []
for line in fileHandle:
fields = line.split('[||]')
therow = {
'dea_reg_nbr':fields[0],
'bus_actvty_cd':fields[1],
'drug_schd':fields[3],
#50 more columns like this
}
thelist.append(therow)
fileHandle.close()
#now I have thelist which is what I want
和繁榮,現在我有一個字典的名單,它的作品。我想要一個清單,因爲我關心訂單,而字典是因爲它是預期的下游。這只是感覺像我應該利用更有效的東西。我認爲這不會超過一百萬行和這麼多的數據。所以,我的問題如下:
以多字符分隔文本文件(UTF-16編碼)和創建字典列表的更有效方式是什麼?
任何想法,將不勝感激!
就這麼你知道,字典是在python 3.6中訂購的;) – Y0da
一個明顯的改進是使用'generator'和'yield'行而不是使用'list',但這不是一個可行的改進,如果你真的需要輸出作爲'list'。 –
這可能是開始與大熊貓合作的好日子。 – Igor