2016-09-28 45 views
2

考慮的一個水平pd.Seriesspd.MultiIndexidx便捷的方式,以重新編制一個多指標

idx = pd.MultiIndex.from_product([list('AB'), [1, 3], list('XY')], 
           names=['one', 'two', 'three']) 
s = pd.Series(np.arange(8), idx) 
s 

one two three 
A 1 X  0 
      Y  1 
    3 X  2 
      Y  3 
B 1 X  4 
      Y  5 
    3 X  6 
      Y  7 
dtype: int32 

我想reindexlevel='two'np.arange(4)
我可以做到這一點:

s.unstack([0, 2]).reindex(np.arange(4), fill_value=0).stack().unstack([0, 1]) 

one two three 
A 0 X  0 
      Y  0 
    1 X  0 
      Y  1 
    2 X  0 
      Y  0 
    3 X  2 
      Y  3 
B 0 X  0 
      Y  0 
    1 X  4 
      Y  5 
    2 X  0 
      Y  0 
    3 X  6 
      Y  7 
dtype: int32 

但如果存在,我正在尋找更直接的東西。有任何想法嗎?

回答

2

不幸的是如果需要reindexMultiIndex,需要各個層面:

mux = pd.MultiIndex.from_product([list('AB'), np.arange(4), list('XY')], 
           names=['one', 'two', 'three']) 

print (s.reindex(mux, fill_value=0)) 
one two three 
A 0 X  0 
      Y  0 
    1 X  0 
      Y  1 
    2 X  0 
      Y  0 
    3 X  2 
      Y  3 
B 0 X  0 
      Y  0 
    1 X  4 
      Y  5 
    2 X  0 
      Y  0 
    3 X  6 
      Y  7 
dtype: int32 

編輯的評論:

idx = pd.MultiIndex.from_tuples([('A', 1, 'X'), ('B', 3, 'Y')], 
           names=['one', 'two', 'three']) 
s = pd.Series([5,6], idx) 
print (s) 
one two three 
A 1 X  5 
B 3 Y  6 
dtype: int64 

mux = pd.MultiIndex.from_tuples([('A', 0, 'X'), ('A', 1, 'X'), 
           ('A', 2, 'X'), ('A', 3, 'X'), 
           ('B', 0, 'Y'), ('B', 1, 'Y'), 
           ('B', 2, 'Y'), ('B', 3, 'Y')], 
           names=['one', 'two', 'three']) 

print (s.reindex(mux, fill_value=0)) 
one two three 
A 0 X  0 
    1 X  5 
    2 X  0 
    3 X  0 
B 0 Y  0 
    1 Y  0 
    2 Y  0 
    3 Y  6 
dtype: int64 

直接解決

new_lvl = np.arange(4) 
mux = [(a, b, c) for b in new_lvl for a, c in s.reset_index('two').index.unique()] 
s.reindex(mux, fill_value=0).sort_index() 

one two three 
A 0 X  0 
      Y  0 
    1 X  0 
      Y  1 
    2 X  0 
      Y  0 
    3 X  2 
      Y  3 
B 0 X  0 
      Y  0 
    1 X  4 
      Y  5 
    2 X  0 
      Y  0 
    3 X  6 
      Y  7 
dtype: int64 
+0

這正是我在想的事情。但是,我無法在任何'MultiIndex'上一般使用'from_product'。例如,如果原始索引是'[('A',1,'X'),('B',3,'Y')]',我希望'level ='兩個'reindex' ''將會返回'[''A',0,'X'),('A',1,'X'),('A',2,'X'),('A',3'' ('B',0,'Y'),('B',1,'Y'),('B',2,'Y'), )]' – piRSquared

+0

你是對的,你一般可以使用'from_product'。您只需要以某種方式創建新索引,然後重新索引。也許'from_tuples'。 – jezrael

+1

然後更復雜的是創建元組 - 也許列表理解可能會有幫助。 – jezrael

相關問題