從技術上講,這不是一個編程問題,而是一個數學問題。但我認爲你最好使用方差 - 協方差矩陣。或者相關矩陣,如果價值尺度有很大的不同,比如說,而不是有:
>>> x
array([[5, 3, 0],
[3, 0, 5],
[5, 5, 0],
[1, 1, 7]])
您有:
>>> x
array([[5, 300, 0],
[3, 0, 5],
[5, 500, 0],
[1, 100, 7]])
爲了得到方差COV矩陣:
>>> np.cov(x)
array([[ 6.33333333, -3.16666667, 6.66666667, -8. ],
[ -3.16666667, 6.33333333, -5.83333333, 7. ],
[ 6.66666667, -5.83333333, 8.33333333, -10. ],
[ -8. , 7. , -10. , 12. ]])
或相關矩陣:
>>> np.corrcoef(x)
array([[ 1. , -0.5 , 0.91766294, -0.91766294],
[-0.5 , 1. , -0.80295507, 0.80295507],
[ 0.91766294, -0.80295507, 1. , -1. ],
[-0.91766294, 0.80295507, -1. , 1. ]])
這是看它的方式,對角線單元格,即(0,0)
單元格,是X中的第1個向量與它自己的相關性,所以它是1.其他單元格,即(0,1)
單元格,是X中的第一個和第二個矢量。它們是負相關的。或者類似地,第一和第三個細胞是正相關的。
協方差矩陣或相關矩陣避免@Akavall指出的零問題。
我認爲協變方法比我的解決方案更好。 – Akavall