的程序,我有工作輸出結果outputed製表符分隔的文件看起來像這樣:使用熊貓下令每隔兩行
marker A B C
Bin_1 1 2 1
marker C G H B T
Bin_2 3 1 1 1 2
marker B H T Z Y A C
Bin_3 1 1 2 1 3 4 5
我想,這樣它看起來像這樣來解決它:
marker A B C G H T Y Z
Bin_1 1 2 1 0 0 0 0 0
Bin_2 0 1 3 1 1 1 0 0
Bin_3 4 1 5 0 1 2 3 1
這是我迄今爲止
import pandas as pd
from collections import OrderedDict
df = pd.read_csv('markers.txt',header=None,sep='\t')
x = map(list,df.values)
list_of_dicts = []
s = 0
e =1
g = len(x)+1
while e < g:
new_dict = OrderedDict(zip(x[s],x[e]))
list_of_dicts.append(new_dict)
s += 2
e += 2
起初,我將這些以字典,然後WA我們要做一些計數並重新創建一個數據框,但這似乎需要花費大量的時間和內存來完成一項簡單的任務。任何建議,以更好的方式來解決這個問題?