2015-12-22 85 views
0

我有一個數據框和一系列我想要將滾動相關性作爲新的數據框返回。熊貓數據幀與系列的相關性

因此,我有df1中的3列,我想返回一個新的數據框,這是每個這些列與Series對象的滾動關聯。

import pandas as pd 

df1 = pd.read_csv('https://bpaste.net/raw/d0456d3a020b') 
df1['Date'] = pd.to_datetime(df1['Date']) 
df1 = df1.set_index(df1['Date']) 
del df1['Date'] 


df2 = pd.read_csv('https://bpaste.net/raw/d5cb455cb091') 
df2['Date'] = pd.to_datetime(df2['Date']) 
df2 = df2.set_index(df2['Date']) 
del df2['Date'] 


pd.rolling_corr(df1, df2) 

結果https://bpaste.net/show/58b59c656ce4 給出NaN和1S僅

pd.rolling_corr(df1['IWM_Close'], spy, window=22) 

給出了理想的系列回來了,但我並沒有通過數據幀的列要循環。有沒有更好的方法來做到這一點?

謝謝。

回答

1

我相信你的第二個輸入必須是Series才能與第一個DataFrame中的所有columns相關。

這工作:

index = pd.DatetimeIndex(start=date(2015,1,1), freq='W', periods = 100) 
df1 = pd.DataFrame(np.random.random((100,3)), index=index) 
df2 = pd.DataFrame(np.random.random((100,1)), index=index) 
print(pd.rolling_corr(df1, df2.squeeze(), window=20).tail()) 

,或者對於相同的結果:

df2 = pd.Series(np.random.random(100), index=index) 
print(pd.rolling_corr(df1, df2, window=20).tail()) 

        0   1   2 
2016-10-30 -0.170971 -0.039929 -0.091098 
2016-11-06 -0.199441 0.000093 -0.096331 
2016-11-13 -0.213728 -0.020709 -0.129935 
2016-11-20 -0.075859 0.014667 -0.153830 
2016-11-27 -0.114041 0.019886 -0.155472 

但這並不 - 注意失蹤.squeeze() - 只有相關匹配columns

print(pd.rolling_corr(df1, df2, window=20).tail()) 

        0 1 2 
2016-10-30 0.019865 NaN NaN 
2016-11-06 0.087075 NaN NaN 
2016-11-13 0.011679 NaN NaN 
2016-11-20 -0.004155 NaN NaN 
2016-11-27 0.111408 NaN NaN