2013-03-27 80 views
3

我有一個相當簡單的問題,需要在matlab中尋址。我想我理解,但我需要有人澄清我正確地做到這一點:matlab相關性和重要值

在下面的示例中,我試圖計算兩個向量之間的相關性和相關性的p值。

dat = [1,3,45,2,5,56,75,3,3.3]; 
dat2 = [3,33,5,6,4,3,2,5,7]; 

[R,p] = corrcoef(dat,dat2,'rows','pairwise'); 
R2 = R(1,2).^2; 
pvalue = p(1,2); 

從這我有一個R2值爲0.11和p值爲0.38。這是否意味着矢量相關係數爲0.11(即11%),並且預計這將出現相同的38%,因此62%的時間會出現不同的相關性?

回答

4
>> [R,p] = corrcoef(dat,dat2,'rows','pairwise') 

R = 

    1.0000 -0.3331 
    -0.3331 1.0000 


p = 

    1.0000 0.3811 
    0.3811 1.0000 

相關性爲-0.3331,p值爲0.3811。後者是當真實相關性爲零時,通過隨機機會獲得-0.3331相關性的概率。 p值很大,所以我們不能拒絕在任何合理的顯着性水平上不相關的零假設。

3

相關係數這裏是

r(1,2) 
ans = 
    -0.3331 

這是-33.3%,它告訴你的是,兩個數據集是負線性相關的相關性。您可以通過繪製他們看到這一點:

plot(dat, dat2, '.'), grid, lsline 

enter image description here

相關的p值

p(1,2) 
ans = 
    0.3811 

這就告訴你,即使有沒有兩個隨機之間的相關性變量,那麼在9個觀測的樣本中,您將會看到至少與極端相關的相關性約爲-33.3%,時間約爲38.1%。

通過至少和我一樣極端我們的意思是,樣本中測量的相關性低於-33.3%,或高於33.3%。

鑑於p值如此之大,您無法可靠地得出關於是否應拒絕零相關零假設的結論。