2014-04-08 90 views
1

樣本數據.txt文件: -最好的方式存儲在SQL

Pamplona ['gorasanjuan'] 
Halifax ['shippingsaturdaywithlindsey'] 
Nottinghamshire ['goodluck'] 
Eindhoven ['ngfcompetitie', 'roadtothehoofdklasse'] 
Rotterdam ['p2000'] 
--- 
--- 
  1. 什麼是最適合的庫/ AP在蟒蛇解析存儲在.txt文件中的上述格式的數據,以便將其存儲在sql中(使用python中的sqlite)或數據報中?

  2. 哪一個更可取,存儲在sql數據庫中或存儲爲數據報? 它將被操縱並導出用於可視化目的。

回答

0

您可以使用re將每行分割爲關鍵字和其餘列表。由於列表準確地爲JSON格式,因此您可以使用模塊json來解析它們(因此您必須用"替換')。例如:

import json 
import re 

data = dict() 

with open("test.txt", "r") as fd: 
    for line in fd.readlines(): 
     m = re.match("^(\w+)(.*)", line) 
     data[m.group(1)] = json.loads(m.group(2).replace("'", "\"")) 

print data 

隨着文件test.txt

Pamplona ['gorasanjuan'] 
Halifax ['shippingsaturdaywithlindsey'] 
Nottinghamshire ['goodluck'] 
Eindhoven ['ngfcompetitie', 'roadtothehoofdklasse'] 
Rotterdam ['p2000'] 

你得到的輸出:

{'Rotterdam': [u'p2000'], 'Halifax': [u'shippingsaturdaywithlindsey'], 'Nottinghamshire': [u'goodluck'], 'Pamplona': [u'gorasanjuan'], 'Eindhoven': [u'ngfcompetitie', u'roadtothehoofdklasse']} 

對於你也可以使用一個鍵值店一樣levelDB數據庫。

相關問題