2017-07-15 56 views
0

我有一個下一個任務如何申請規模規則很多列在新的數據集

a = data.frame(a= c(1,2,3,4,5,6)) # dataset 
range01 <- function(x){(x-min(a$a))/(max(a$a)-min(a$a))} # rule for scale 
b = data.frame(a = 6) # newdaset 
lapply(b$a, range01) # we can apply range01 for this dataset because we use min(a$a) in the rule 

但我怎麼可以把這個當我有很多列在我的數據集?像下面

a = data.frame(a= c(1,2,3,4,5,6)) 
b = data.frame(b= c(1,2,3,3,2,1)) 
c = data.frame(c= c(6,2,4,4,5,6)) 
df = cbind(a,b,c) 
df 
new = data.frame(a = 1, b = 2, c = 3) 

我當然可以制定規則,爲每個變量

range01a <- function(x){(x-min(df$a))/(max(df$a)-min(df$a))} 

但它很長的路要走。如何使它方便?

回答

1

您可以重新定義您的比例函數,因此它需要兩個參數;一個被縮放和一個定標器,如下所示,然後對兩個數據幀使用Map

scale_custom <- function(x, scaler) (x - min(scaler))/(max(scaler) - min(scaler)) 

Map(scale_custom, new, df) 
#$a 
#[1] 0 

#$b 
#[1] 0.5 

#$c 
#[1] 0.25 

如果你需要的數據幀結果:

as.data.frame(Map(scale_custom, new, df)) 
# a b c 
#1 0 0.5 0.25 
1

您可以利用以下事實:列名稱newdf是相同的。如果兩個數據框中列的順序不相同,可能會有所幫助。

sapply(names(new), function(x) (new[x]-min(df[x]))/(max(df[x])-min(df[x]))) 
#$a.a 
#[1] 0 

#$b.b 
#[1] 0.5 

#$c.c 
#[1] 0.25 

擺在data.frame

data.frame(lapply(names(new), function(x) (new[x]-min(df[x]))/(max(df[x])-min(df[x])))) 
# a b c 
#1 0 0.5 0.25