2016-06-09 143 views
4

什麼是「零均值和單位方差」以及如何計算/歸一化R中的單列文件?我還希望將歸一化值分成兩類:如何計算/歸一化零均值和單位方差

  1. 歸一化值的標準偏差(SD)的平均值之上的至少0.5
  2. 歸一化值的至少0.5的平均標準偏差(SD)下面

由於

回答

4

引證「零均值和單位方差」是指歸一化的變量的0均值和1.一種方法中的R正常化變量的標準偏差(和方差)是使用scale功能。這裏有一個例子:

# create vector 
set.seed(1234) 
temp <- rnorm(20, 3, 7) 

# take a look 
> mean(temp) 
[1] 1.245352 
> sd(temp) 
[1] 7.096653 

# scale vector 
tempScaled <- c(scale(temp)) 

# take a look 
> mean(tempScaled) 
[1] 1.112391e-17 
> sd(tempScaled) 
[1] 1 

# find values below 0.5 standard deviation in scaled vector 
tempScaled[tempScaled < -0.5] 
# find values above 0.5 standard deviation in scaled vector 
tempScaled[tempScaled > 0.5] 

您還可以通過擴展用手變量很容易地:

tempScaled2 <- (temp - mean(temp))/sd(temp) 

> all.equal(tempScaled, tempScaled2) 
[1] TRUE