我有多個製表符分隔的文件,全部具有相同的條目。我打算讀取每個文件選擇第一列作爲索引。我的最終表將有第一列作爲索引映射到所有文件的最後一列。爲此,我編寫了一個熊貓代碼,但不是很棒的代碼。有沒有其他方法可以做到這一點?通過熊貓的Accumalate列
import pandas as pd
df1 = pd.read_csv("FB_test.tsv",sep='\t')
df1_idx = df1.set_index('target_id')
df1_idx.drop(df1_idx[['length','eff_length','est_counts']],inplace=True, axis=1)
print(df1_idx)
df2 = pd.read_csv("Myc_test.tsv",sep='\t')
df2_idx = df2.set_index('target_id')
df2_idx.drop(df2_idx[['length','eff_length','est_counts']],inplace=True, axis=1)
print(df2_idx)
frames = [df1_idx, df2_idx]
results = pd.concat(frames, axis=1)
results
它產生的輸出是,
tpm
target_id
A 0
B 0
C 0
D 0
E 0
tpm
target_id
A 1
B 1
C 1
D 1
E 1
Out[18]:
target_id tpm tpm
A 0 1
B 0 1
C 0 1
D 0 1
E 0 1
如何循環它,這樣,我看每個文件和實現這一相同的輸出?
感謝, AP