2016-06-20 56 views
1

我有數據幀,這是讀這樣的事情添加額外的索引,以大熊貓數據幀

data = [pd.read_csv(f, index_col=None, header=None) for f in temp] 
flow = pd.DataFrame(data) 

如果我打印flow我得到的

[[.... 
[128 rows x 14 columns]] 
[128 rows x 14 columns]] 
. 
. 
[128 rows x 14 columns]]] 

因此,這意味着輸出的列表每個[128 rows x 14 columns]有一個索引,我有60這樣。我想要做的是讀取其中包含一列數據(60行),它通過做

new_data=pd.read_csv(f_new, index_col=None, header=None) 

現在的問題是看起來像這樣

[1 1 1 ... 2 2 2 ... 3 3 3] 

我可以讀這另一個CSV文件我可以把一切都因爲它而只是添加new_data作爲額外的索引,它應該表現出這樣的事情:

[[.... 
0 1 [128 rows x 14 columns]] 
1 1 [128 rows x 14 columns]] 
2 1 . 
3 2 . 
4 2 [128 rows x 14 columns]]] 

這可能嗎?

+0

你嘗試:'流= flow.set_index([flow.index,NEW_DATA])'? – MaxU

+0

@MaxU這似乎工作,我可以命名這兩個指標?還可以發佈這個答案,以便我可以接受它? – Akshay

回答

1

試試這個:

flow = flow.set_index([flow.index, new_data]).rename_axis(['idx_col1','idx_col2'])