2014-10-28 153 views
-4

我有包含14列預測變量和1列解變量(y)的數據。如何使R中的數據標準化和非標準化?

我想知道是否有任何內置的功能正常化和R.

非規範化的數據,謝謝。

+1

你能否爲更廣泛的受衆多解釋一下?並給出一個可重複的例子?你可能會尋找'reshape'函數,或者是Hadley Wickham廣泛使用的'reshape2'和/或'tidyr'軟件包。 – 2014-10-28 11:54:51

回答

0

包的normDataWithin {Rmisc}可以使用:可用於http://www.inside-r.org/packages/cran/Rmisc/docs/normDataWithin

否則以下方法:

(可變平均值)/ SD。下面的代碼可用於data.frame:

mydata$myNormalizedVar<-(mydata$myvar-mean(mydata$myvar))/sd(myvar) 

日誌(日誌10),LOG2和平方根(SQRT)

普通位數歸一化或正常位數變換。試試:

quantNorm = function(x){qnorm(rank(x,ties.method = "average")/(length(x)+1))} 
hist(quantNorm(1:10000),100)