2013-12-19 57 views
0

我想計算2個變量數組的相關性,但數組在中間脫節 - 但我試圖獲得一個相關係數如何求和相關,或計算脫節變量的相關性

示例;

x:1, 2, [disjointed], 5.1, 5.2, 5.3, 5.4, 5.5, 5.6 

y:2, 4, [disjointed], 9.1, 9, 8.9, 8.8, 8.7, 8.6 

見我上傳的Excel文件:http://www.qfpost.com/file/d?g=1UfQx3cUj

因爲在中間的不相交的,有一定程度的值的跳躍,並且當我一起關聯整個組可變的我獲得的相關係數這並不真正反映變量之間的關係

我將如何能夠計算出一個相關係數?我可以計算兩個獨立的相關性,但總之有兩個相關性總和?

謝謝你的先生

[編輯:格式化&還添加鏈接到Excel文件]

+2

可以提供代碼經由薈萃分析整合他們現在計算它?什麼是「脫節」? –

+0

Hi Ilya;我使用excel的= correl來計算,基本上,我有2個數組集合(稱爲array1和array2),我試圖在array1正在下降時計算變量的相關性,並計算array1中變量的相關性增加;因爲這個我在中間脫節,因爲array1在中間增加,我試圖在array1減少時計算相關性。希望這會有所幫助,當我回家時,我會上傳我的Excel數據[編輯:句子] – user3117403

回答

0

簡短的回答:看依存度比其他的相關措施。

如果我正確理解你的問題,你都在思考一個問題,即數據是這樣的:

 
#R code 
N=500 
set.seed(10) 
x = rnorm(N) 
y = rnorm(N,10*x) 
plot(x,y) 
abline(reg = lm(y~x)) 
#correlation 
cor(x,y) 
[1] 0.9954706 

enter image description here

這些顯然是相關的X和Y變量。

然而,你的情況看起來更像這個(顯然,這是簡化的顯示點):

 
abs = ifelse(x>0, 10, -10) 
y2 = rnorm(N,abs*x) 
plot(x,y2) 
abline(reg = lm(y2~x)) 
cor(x,y2) 
[1] -0.01952952 

enter image description here

相關性是兩個變量之間的線性關係的函數。在最上面的圖像中,很明顯Y很大程度上取決於X,接近1的相關性反映了線性關係。然而,在底部圖像中,即使Y嚴重依賴於X,相關係數幾乎爲0(並且在非常大的樣本中確實爲0)。

這只是一個相關性的缺點 - 沒有「修復」,可以將X和Y的相關性在X = 0之上和之下進行求和。如果您想要更好地表徵數據的相關方式,請查看(例如)非線性迴歸技術。更好的是,與你所在機構的統計師一起工作(或者在附近找一個統計員)。在沒有看到更多數據的情況下,無法確切知道您需要什麼。