2016-02-12 155 views
6

以下是我的一個文本文件的數據集。製作動態詞典列表python

2.1,3.5,1.4,0.2,Iris 
4.9,3.0,1.4,0.2,Ilia 
3.7,3.2,1.3,0.2,Iridium 

有一個名爲列表:

list_of_keys 

持有該列表中的下列值

['S_Length','S_Width','P_Length','P_Width','Predicate'] 

所以,問題是,我想創建字典的一個列表保留我所有的數據(來自文本文件)使用list_of_keys as keys爲詞典如下:

dict = 
     {'S_Length': 2.1, 'S_Width':3.5 , 'P_Length': 1.4, 'P_Width': 0.2, 'Predicate': Iris}, 
     {'S_Length': 4.9, 'S_Width':3.0 , 'P_Length': 1.4, 'P_Width': 0.2, 'Predicate': Ilia}, 
     ... so on! 

我有什麼到現在:

# store all data from the text files as list 
all_examples = file.readlines() 

for outer_index in range(len(all_examples)): 
    for inner_index in range(0, len(list_of_keys)+1): 

回答

4

您可以使用一個發電機之類的函數如下:

def func(): 
    list_of_keys = ['S_Length','S_Width','P_Length','P_Width','Predicate'] 
    with open('example.txt') as f: 
     for line in f: 
      yield dict(zip(list_of_keys,line.strip().split(','))) 

print(list(func())) 
[{'P_Width': '0.2', 'S_Length': '2.1', 'Predicate': 'Iris', 'S_Width': '3.5', 'P_Length': '1.4'}, {'P_Width': '0.2', 'S_Length': '4.9', 'Predicate': 'Ilia', 'S_Width': '3.0', 'P_Length': '1.4'}, {'P_Width': '0.2', 'S_Length': '3.7', 'Predicate': 'Iridium', 'S_Width': '3.2', 'P_Length': '1.3'}] 

可以逐行讀取文件中的行,並分割線,然後創建對的鍵和值使用zip函數,然後將它們轉換爲字典。

請注意,由於文件對象是一個迭代器,因此您可以遍歷文件對象並使用with語句來打開文件,該文件將關閉塊末尾的文件。

正如你也可以使用csv模塊讀取文本文件中的另一個替代性和更Python的方式:

import csv 
def func(): 
    list_of_keys = ['S_Length','S_Width','P_Length','P_Width','Predicate'] 
    with open('example.txt') as f: 
     spamreader = csv.reader(f, delimiter=',') 
     return [dict(zip(list_of_keys,row)) for row in spamreader] 

print func() 

在這裏,因爲csv.reader接受一個分隔符參數,返回你的線路全部在一個迭代器,你不分離你需要循環你的文件並手動分割它。

如果你想保留您可以在這兩種情況下使用collections.OrderedDict順序:

from collections import OrderedDict 
import csv 
def func(): 
    list_of_keys = ['S_Length','S_Width','P_Length','P_Width','Predicate'] 
    with open('example.txt') as f: 
     spamreader = csv.reader(f, delimiter=',') 
     return [OrderedDict(zip(list_of_keys,row)) for row in spamreader] 

print func() 
[OrderedDict([('S_Length', '2.1'), ('S_Width', '3.5'), ('P_Length', '1.4'), ('P_Width', '0.2'), ('Predicate', 'Iris')]), OrderedDict([('S_Length', '4.9'), ('S_Width', '3.0'), ('P_Length', '1.4'), ('P_Width', '0.2'), ('Predicate', 'Ilia')]), OrderedDict([('S_Length', '3.7'), ('S_Width', '3.2'), ('P_Length', '1.3'), ('P_Width', '0.2'), ('Predicate', 'Iridium')])] 
+1

對於使用誰遍歷文件的OP '範圍(len())'這需要稍微多一點解釋。 – bereal

+0

@bereal的確,我剛剛添加。 – Kasramvd

0

如果認爲你必須使用分割的,字符串,然後使用namedtuple到每一行分別進行映射。

2

您只需要使用拆分並做一些迭代。

嘗試:

list_of_keys = ['S_Length','S_Width','P_Length','P_Width','Predicate'] 

list_of_dict = [] 

with open('mydata.txt', "r") as f: 
    for line in f.readlines(): 
     parts = line.strip().split(",") 
     mydict = {} 
     i = 0 
     for k in list_of_keys: 
      mydict[k] = parts[i] 
      i += 1 
     list_of_dict.append(mydict) 

print list_of_dict 

或者:

list_of_keys = ['S_Length','S_Width','P_Length','P_Width','Predicate'] 

list_of_dict = [] 

with open('mydata.txt', "r") as f: 
    for line in f.readlines(): 
     parts = line.strip().split(",") 
     mydict = dict(zip(list_of_keys,parts)) 
     list_of_dict.append(mydict) 

print list_of_dict 
2

更清潔的代碼,你可以從熊貓使用的功能to_dict

import pandas as pd 

df = pd.read_csv('example.txt') 
list_of_keys = ['S_Length','S_Width','P_Length','P_Width','Predicate'] 
df.columns = list_of_keys 

dict = df.to_dict(orient='records') 

print dict[0] 
{'P_Width': '0.2', 'S_Length': '4.9', 'Predicate': 'Ilia', 'S_Width': '3.0', 'P_Length': '1.4'}