2010-05-28 56 views
2

我有大型文件包含〜100,000行。每一行對應一個簇,每行中的每個條目都是一個引用i.d.對於另一個文件(在這種情況下是蛋白質結構),例如Python - 從文件到數據結構?

1hgn 1dju 3nmj 8kfn 
9opu 7gfb 
4bui 

我需要在文件中讀入列表,其中每行是子列表,因此保留了集羣的完整性,例如,

nested_list = [['1hgn', '1dju', '3nmj', '8kfn'], ['9opu', '7gfb'], ['4bui']] 

我當前的代碼創建一個嵌套列表,但每個列表中的條目是單個字符串,而不是逗號分隔。因此,我不能輕易地將索引與索引拼接在一起。

任何幫助非常感謝。

感謝, 小號:-)

回答

13

超級簡單:

with open('myfile', 'r') as f: 
    data = [line.split() for line in f] 
+2

都能跟得上 - 這將做什麼的任擇議定書要求。包括蟒蛇和電池。 – 2010-05-28 12:32:35

6

你要調查str.split()方法。

>>> '1hgn 1dju 3nmj 8kfn'.split() 
['1hgn', '1dju', '3nmj', '8kfn']