2016-07-12 83 views
2

我在想,如果你可以創建Logistic迴歸的一個仿製版本,我指的是一個可以讓使用不同名稱的預測數據集的變量。通用Logistic迴歸中的R

+0

將佔位符置入統計模型的想法對我來說並沒有什麼意義。也許你可以解釋你的意思。這可能更像是一個stats.stackexchange.com問題。 –

+0

肯定的:我目前正在分析來自多個來源的數據。由於源都有不同的變量名稱和位置,以及數據被稱爲不同的名稱,可以有隻是在採用的值從Excel文件,我將導入迴歸佔位符變量?這將(在我心中)去除不得不經常在創建模型 – Buskea22

+0

那好吧,所以只要變量代表相同的變量,都在你可以訓練Logit模型分析(同等規模那是之前重命名變量障礙綽號後勤),然後當你將它們導入重命名新變量之後 –

回答

0
require(mtcars) # this represents your training data 
train <- mtcars 

logit <- glm(vs~mpg, data = train, family = "binomial") 

generic.logit <- function(mpg, data=test){ 
    test   <- data 
    test$mpg  <- mpg 
    mypredictions <- predict(logit, test) 
    return(mypredictions) 
} 

test <- mtcars 
test$random_name <- test$mpg 
test$mpg   <- NULL # this represents your prediction data set 

generic.logit(data=test, mpg = test$random_name) 



     Mazda RX4  Mazda RX4 Wag   Datsun 710  Hornet 4 Drive Hornet Sportabout    Valiant 
     0.2056113   0.2056113   0.9803557   0.3777768   -0.7843397   -1.0425879 
    Duster 360   Merc 240D   Merc 230   Merc 280   Merc 280C   Merc 450SE 
    -2.6781592   1.6690173   0.9803557   -0.5691330   -1.1717119   -1.7742908 
    Merc 450SL   Merc 450SLC Cadillac Fleetwood Lincoln Continental Chrysler Imperial   Fiat 128 
    -1.3869187   -2.2907871   -4.3567720   -4.3567720   -2.5059938   5.1123255 
    Honda Civic  Toyota Corolla  Toyota Corona Dodge Challenger   AMC Javelin   Camaro Z28 
     4.2514984   5.7579458   0.4208181   -2.1616630   -2.2907871   -3.1085728 
    Pontiac Firebird   Fiat X1-9  Porsche 914-2  Lotus Europa  Ford Pantera L  Ferrari Dino 
     -0.5691330   2.9172165   2.3576790   4.2514984   -2.0325390   -0.3539262 
     Maserati Bora   Volvo 142E 
     -2.3768698   0.3777768 
+0

這是一般不明智使用'$'裏面的功能。取決於目標,最好使用'[[varname]]'或'[['varname']]''。 –

+0

@ 42我從來沒有遇到過問題。任何特定的原因? –

+0

這個功能甚至在做什麼?爲什麼不''預測(logit,transform(mtcars,mpg = test $ random_name))' – Zelazny7