最好的方式存儲在SQL

樣本數據.txt文件： -最好的方式存儲在SQL

Pamplona ['gorasanjuan'] 
Halifax ['shippingsaturdaywithlindsey'] 
Nottinghamshire ['goodluck'] 
Eindhoven ['ngfcompetitie', 'roadtothehoofdklasse'] 
Rotterdam ['p2000'] 
--- 
---

什麼是最適合的庫/ AP在蟒蛇解析存儲在.txt文件中的上述格式的數據，以便將其存儲在sql中（使用python中的sqlite）或數據報中？
哪一個更可取，存儲在sql數據庫中或存儲爲數據報？它將被操縱並導出用於可視化目的。

來源

2014-04-08 user3329672

您可以使用re將每行分割爲關鍵字和其餘列表。由於列表準確地爲JSON格式，因此您可以使用模塊json來解析它們（因此您必須用"替換'）。例如：

import json 
import re 

data = dict() 

with open("test.txt", "r") as fd: 
    for line in fd.readlines(): 
     m = re.match("^(\w+)(.*)", line) 
     data[m.group(1)] = json.loads(m.group(2).replace("'", "\"")) 

print data

隨着文件test.txt：

Pamplona ['gorasanjuan'] 
Halifax ['shippingsaturdaywithlindsey'] 
Nottinghamshire ['goodluck'] 
Eindhoven ['ngfcompetitie', 'roadtothehoofdklasse'] 
Rotterdam ['p2000']

你得到的輸出：

{'Rotterdam': [u'p2000'], 'Halifax': [u'shippingsaturdaywithlindsey'], 'Nottinghamshire': [u'goodluck'], 'Pamplona': [u'gorasanjuan'], 'Eindhoven': [u'ngfcompetitie', u'roadtothehoofdklasse']}

對於你也可以使用一個鍵值店一樣levelDB數據庫。

來源

2014-04-08 09:55:51

最好的方式存儲在SQL

回答

相關問題