我需要能夠按列計算數據幀的相關係數。例如,我的數據幀是這樣的:如何計算數據框中某些列的相關性?
dput(df)
structure(list(Server = structure(c(1L, 1L, 1L, 1L, 2L, 2L, 2L),
.Label = c("server101", "server102"), class = "factor"),
JVM = structure(c(1L, 2L, 3L, 4L, 2L, 3L, 4L),
.Label = c("JVM1", "JVM2", "JVM3", "JVM4"),
class = "factor"), cpu = c(10L, 20L, 30L, 20L, 10L, 20L, 20L),
trans = c(1000L, 2000L, 30L, 30L, 50L, 60L, 30L)),
.Names = c("Server", "JVM", "cpu", "trans"),
class = "data.frame", row.names = c(NA, -7L))
我需要能夠由每個JVM和服務器計算的CPU和反式之間係數的相關性。
我已經試過這樣:
apply(df[,c('trans','cpu')], function(x) FUN=cor(x["trans"],x["cpu"]))
任何想法我怎麼能做到這一點?
它需要按服務器分組而不是JVM – user1471980
是否需要按兩者進行分組?也許舉一個結果應該是什麼樣子的例子 –