2017-05-10 38 views
1

我使用下面的代碼數據框:多指標/重塑大熊貓版本之間的差異

import pandas as pd 
import numpy as np 


index = pd.DatetimeIndex(['2017-05-04', '2017-05-05', '2017-05-08', '2017-05-09', 
      '2017-05-10'], dtype='datetime64[ns]',name = 'date', freq='B') 
columns = pd.MultiIndex(levels=[['HSBA LN Equity', 'UCG IM Equity', 'ISP IM Equity'], ['LAST PRICE', 'HIGH', 'LOW']], 
     labels=[[0, 0, 0, 1, 1, 1, 2, 2, 2], [0, 1, 2, 0, 1, 2, 0, 1, 2]]) 
data = np.array([[ 663.8, 672.5, 661.1, 15.97, 16.02, 15.49, 2.76, 2.768, 2.694], 
      [ 658.6, 663.9, 656.0, 16.22, 16.48, 15.77, 2.842, 2.868, 2.77 ], 
      [ 660.6, 664.1, 658.9, 16.01, 16.49, 15.94, 2.852, 2.898, 2.826], 
      [ 664.9, 669.2, 662.5, 15.90, 16.41, 15.90, 2.848, 2.898, 2.842], 
      [ 670.9, 673.4, 663.8, 16.09, 16.15, 15.59, 2.85, 2.888, 2.802]]) 
df = pd.DataFrame(data, columns=columns, index = index) 

輸出看起來是這樣的:

  HSBA LN Equity    UCG IM Equity    \ 
      LAST PRICE HIGH LOW LAST PRICE HIGH LOW 
date                 
2017-05-04   663.8 672.5 661.1   15.97 16.02 15.49 
2017-05-05   658.6 663.9 656.0   16.22 16.48 15.77 
2017-05-08   660.6 664.1 658.9   16.01 16.49 15.94 
2017-05-09   664.9 669.2 662.5   15.90 16.41 15.90 
2017-05-10   670.9 673.4 663.8   16.09 16.15 15.59 

     ISP IM Equity     
      LAST PRICE HIGH LOW 
date          
2017-05-04   2.760 2.768 2.694 
2017-05-05   2.842 2.868 2.770 
2017-05-08   2.852 2.898 2.826 
2017-05-09   2.848 2.898 2.842 
2017-05-10   2.850 2.888 2.802 

由於從0.19.2升級到Pandas 0.20.1當我使用df = df.stack(0)的輸出如下所示:

       HIGH LAST PRICE  LOW 
date             
2017-05-04 HSBA LN Equity 672.500  663.800 661.100 
      UCG IM Equity  2.768  2.760 2.694 
      ISP IM Equity 16.020  15.970 15.490 
2017-05-05 HSBA LN Equity 663.900  658.600 656.000 
      UCG IM Equity  2.868  2.842 2.770 
      ISP IM Equity 16.480  16.220 15.770 
2017-05-08 HSBA LN Equity 664.100  660.600 658.900 
      UCG IM Equity  2.898  2.852 2.826 
      ISP IM Equity 16.490  16.010 15.940 
2017-05-09 HSBA LN Equity 669.200  664.900 662.500 
      UCG IM Equity  2.898  2.848 2.842 
      ISP IM Equity 16.410  15.900 15.900 
2017-05-10 HSBA LN Equity 673.400  670.900 663.800 
      UCG IM Equity  2.888  2.850 2.802 
      ISP IM Equity 16.150  16.090 15.590 

該列已更改訂單,股票價格不再匹配正確的代碼。

這是一個錯誤?

+0

感謝您的檢查。我仍然有這個問題。我想知道是否有什麼關於我的DataFrame是奇怪的。 – dsugasa

+0

是的,這對我來說就像是一個bug。還有一個不好的。 :-( – DSM

回答

3

這絕對是一個錯誤,因爲我的兩個團隊大量使用MultiIndex列和堆疊它有點可怕。在您的問題#16323中追查它並作出PR(#16325)。

這已經被合併到master中,並將成爲0.20.2 bugfix版本的一部分,目前計劃於2017年6月13日發佈。

+0

非常感謝。謝謝你的修復和跟進! – dsugasa

+0

@DSM ...我注意到pandas-dev上還存在stack和multiindex的問題。是否與排序有關?這也是一個bug https:/ /stackoverflow.com/a/45194076/6361531?它們可能是相關的嗎? –