-3
dput(x)
structure(list(Date = structure(c(1L, 1L, 1L, 2L, 2L, 2L, 3L,
3L, 3L, 4L, 4L, 4L, 5L, 5L, 5L, 6L, 6L, 6L), .Label = c("1/1/2012",
"2/1/2012", "3/1/2012", "4/1/2012", "5/1/2012", "6/1/2012"), class = "factor"),
Continent = structure(c(3L, 1L, 2L, 3L, 1L, 2L, 3L, 1L, 2L,
3L, 1L, 2L, 3L, 1L, 2L, 3L, 1L, 2L), .Label = c("Asia", "Europe",
"South America"), class = "factor"), Score = c(10L, 4L, 9L,
1L, 9L, 3L, 10L, 0L, 0L, 10L, 4L, 9L, 10L, 4L, 9L, 0L, 0L,
5L), Country = structure(c(1L, 2L, 3L, 1L, 2L, 3L, 1L, 2L,
3L, 1L, 2L, 3L, 1L, 2L, 3L, 1L, 2L, 3L), .Label = c("Brasil",
"China", "Germany"), class = "factor"), mean = c(6.83333333333333,
3.5, 5.83333333333333, 6.83333333333333, 3.5, 5.83333333333333,
6.83333333333333, 3.5, 5.83333333333333, 6.83333333333333,
3.5, 5.83333333333333, 6.83333333333333, 3.5, 5.83333333333333,
6.83333333333333, 3.5, 5.83333333333333), sd = c(4.91596040125088,
3.33166624979154, 3.81663027639129, 4.91596040125088, 3.33166624979154,
3.81663027639129, 4.91596040125088, 3.33166624979154, 3.81663027639129,
4.91596040125088, 3.33166624979154, 3.81663027639129, 4.91596040125088,
3.33166624979154, 3.81663027639129, 4.91596040125088, 3.33166624979154,
3.81663027639129), outlier1 = c(FALSE, FALSE, FALSE, TRUE,
TRUE, FALSE, FALSE, TRUE, TRUE, FALSE, FALSE, FALSE, FALSE,
FALSE, FALSE, TRUE, TRUE, FALSE)), .Names = c("Date", "Continent",
"Score", "Country", "mean", "sd", "outlier1"), row.names = c(NA,
-18L), class = c("data.table", "data.frame"), .internal.selfref = <pointer: 0x0000000005e70788>)
我計算出每個國家的平均值,sd和outlier1。我想爲每個國家申請一個outlier_score排名。有人可以指出如何計算此數據集上的離羣值分數嗎?計算outlier_score中的R
你如何定義'outlier_score'?我會給他們一個'B-'......另外,你顯示的'dput'不是'data.table'(這是一個包),而是'data.frame'。 – Justin
@Justin,我可以計算出異常值。我想知道它是多麼糟糕。數據點可能距離每個國家的平均值有多遠? – user1471980
請更新您的Q並提供您想要的輸出。 [這可能有所幫助](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example) –