我想計算Pandas DataFrame的列之間的滯後長度的自相關係數。我的數據的一個片段是:計算熊貓DataFrame沿每列的自相關
RF PC C D PN DN P
year
1890 NaN NaN NaN NaN NaN NaN NaN
1891 -0.028470 -0.052632 0.042254 0.081818 -0.045541 0.047619 -0.016974
1892 -0.249084 0.000000 0.027027 0.067227 0.099404 0.045455 0.122337
1893 0.653659 0.000000 0.000000 0.039370 -0.135624 0.043478 -0.142062
除了年,我要計算一個滯後的自相關性爲每列(RF,PC,等...)。
爲了計算自相關,我提取了兩個時間序列,每個列的開始和結束數據相差一年,然後用numpy.corrcoef
計算相關係數。
例如,我寫道:
numpy.corrcoef(data[['C']][1:-1],data[['C']][2:])
(整個數據幀被稱爲data
)。
然而,不幸的是命令返回:
array([[ nan, nan, nan, ..., nan, nan, nan],
[ nan, nan, nan, ..., nan, nan, nan],
[ nan, nan, nan, ..., nan, nan, nan],
...,
[ nan, nan, nan, ..., nan, nan, nan],
[ nan, nan, nan, ..., nan, nan, nan],
[ nan, nan, nan, ..., nan, nan, nan]])
有人可以請告知我如何計算自相關?