熊貓「累積」rolling_corr

是否有任何內置熊貓的方法來找到兩個熊貓系列之間的累積相關性？熊貓「累積」rolling_corr

它應該做的是在pandas.rolling_corr（數據，窗口）中有效固定窗口的左側，以使窗口的寬度增加，最終窗口包含所有數據點。

2016-12-31 Javad

下面是一個方法，map上索引和corr適用於增加系列的大小。

In [116]: df.index.map(lambda x: df[col1].corr(df.loc[:x, col2]))

詳細

In [112]: df = pd.DataFrame(pd.np.random.rand(10,2)) 

In [113]: df 
Out[113]: 
      0   1 
0 0.094958 0.891910 
1 0.482616 0.551912 
2 0.877540 0.573768 
3 0.839921 0.328452 
4 0.334714 0.908346 
5 0.530518 0.837590 
6 0.285152 0.126937 
7 0.386568 0.474815 
8 0.279807 0.939694 
9 0.741882 0.135982 

In [114]: df['roll_corr'] = df.index.map(lambda x: df[0].corr(df.loc[:x, 1])) 

In [115]: df 
Out[115]: 
      0   1 roll_corr 
0 0.094958 0.891910  NaN 
1 0.482616 0.551912 -1.000000 
2 0.877540 0.573768 -0.832929 
3 0.839921 0.328452 -0.848385 
4 0.334714 0.908346 -0.839698 
5 0.530518 0.837590 -0.791736 
6 0.285152 0.126937 -0.312806 
7 0.386568 0.474815 -0.283357 
8 0.279807 0.939694 -0.354385 
9 0.741882 0.135982 -0.459907

驗證

In [121]: df.corr() 
Out[121]: 
      0   1 
0 1.000000 -0.459907 
1 -0.459907 1.000000 

In [122]: df[:5].corr() 
Out[122]: 
      0   1 
0 1.000000 -0.839698 
1 -0.839698 1.000000

來源

2016-12-31 08:18:00 Zero

謝謝。如果Pandas的開發社區能夠調整所有滾動方法（即rolling_corr/mean/std等），以便他們可以採用布爾「累積」參數，我認爲這是值得的。像'rolling_method'（數據，窗口，暨= False）''。 – Javad

熊貓「累積」rolling_corr

回答

相關問題