我們如何關聯具有不同尺度的兩個數據集/曲線,即一條曲線的y軸範圍爲(0,70000),另一條曲線的y軸範圍爲(0,150000 )。如果它們的尺寸相同,則可以使用cor()函數。我想檢查一條曲線是否與其他/兩條曲線相關。有任何想法嗎?關聯不同尺度的兩個數據集
1
A
回答
1
如果您正在尋找兩組數據之間的相關性,則相關量不依賴於數據集範圍的差異。
例如,我們可以隨機創建一個值爲y
的值,然後對其進行擴展。相關仍然是1:
> y <- rnorm(100)
> y2 <- y*2 + 20
> cor(y, y2)
[1] 1
爲了進一步表明,相關的量是獨立於規模的線性變化,看與不相關的數據的情況下:
> y3 = rnorm(100)
> cor(y, y3)
[1] -0.05293818
> y4 <- y3*2 + 20
> cor(y, y4)
[1] -0.05293818
因此,要回答你的問題。我認爲功能cor
應該仍然適合您。
0
相關性不應該取決於數據的絕對範圍,我不會這麼想。只需將一個數據集乘以一個常數,使其與另一個具有相同的範圍?
3
如果你看看definition of Pearson's product moment of correlation(這是cor
默認計算的),你會發現它是一個線性算子。也就是說,如果a和b是常數,則cor(aX + b,Y)= cor(X,Y)。所以,X和Y之間的差異並不重要。請記住,這種相關性只能測量線性相關性:它們可能是「相關的」,但具有較低的相關性。例如:如果關係是非線性的,就會發生這種情況:例如:
set.seed(100)
x <- rnorm(100)
y <- x^2
cor(x,y)
# 0.1224623
相關問題
- 1. 如何使用T-SQL關聯兩組不同的數據集?
- 2. CakePHP:使用不同的數據庫關聯兩個模型?
- 3. PHP - 合併兩個數組(相同長度)爲一個關聯?
- 4. 關聯數據庫中的兩個表
- 5. 兩個不同類型的關聯在同一個兩個表中的軌道
- 6. 相同的數據集,兩個不同的JTable
- 7. 數據集和數據關聯
- 8. 劇情同一x軸爲兩個不同的數據集
- 9. 合併兩個不同尺寸的堆
- 10. D3根據兩個不同的數據集更改元素?
- 11. 在ggplot2中有兩個不同x尺度和不同幾何數據框的圖例控制
- 12. 來自兩個不同表的Oracle數據集不加入
- 13. 在單個報告中使用兩個不同的數據集
- 14. 深度學習:數據集包含不同尺寸和方向的圖像
- 15. TSQL ORDER-BY與一個不同的數據集聯盟
- 16. 來自兩個不同數據集的項目總數
- 17. 如何使用函數繪製兩個不同的數據集?
- 18. 將兩個相關的數據集綁定到兩個DataGrids
- 19. 聯合使用不同列的兩個火花數據幀
- 20. 繪製不同尺寸的獨立的數據集中的R
- 21. 續集連接兩個不關聯的表
- 22. 關聯python中的網格數據集
- 23. 的Stata:比較兩個數據集落的不同變量
- 24. 如何聯合來自兩個不同數據庫的不同表格?
- 25. SQL從未關聯數據表中的兩個字段到同一個字段?
- 26. 告訴兩個可變的最高金額在兩個不同的數據集
- 27. 比較不同長度的兩個數據幀的行
- 28. 基於與ggplot2不同數據集的兩個傳說
- 29. 將用戶數據庫分爲兩個不同的集合
- 30. makeContrast兩個不同的數據集之間
這可以用來測量兩條曲線之間的相似度嗎?假設有兩個具有非常不同範圍但形狀相似的1維數據集。上述相關性能否成爲它們之間相似性的適當度量? – Kanmani