我有兩列缺少數據。查找排除兩列缺失值的觀察子集
Var1 Var2
1445 40
656 NA
NA NA
607 NA
2098 15
我想計算這些列之間的相關性,同時排除缺少數據的觀測值。我試圖
cor(na.omit(df$Var1),na.omit(df$Var2),method="pearson")
但我得到的心病(na.omit(DF $ VAR1),na.omit
錯誤(DF $ VAR2): 不相容的維度
我認爲這是因爲,而不是採取這兩個變量的交集,我越來越
Var1(NA omit) Var2(NA omit)
1445 40
656 15
607
2098
,所以沒有關聯可以運行,因爲它改變了列的長度。
如何忽略包含NA
的所有觀察值,以便列的長度相同?
'COR(na.omit(DF $ VAR1),na.omit(DF $ VAR2),方法= 「皮爾森」,使用=「成對.complete.obs「)' – kaksat
但是,您可能想要閱讀以下內容:[配對 - 完全關聯被認爲是危險的](http://bwlewis.github.io/covar/missing.html)。 –
謝謝,不知道這個。 – kaksat