我剛剛開始學習R和處理有1470個案例的數據集。數據集的名稱是ABC。使用as.factor,我已將分類變量轉換爲因子。glm函數沒有采取正確的數據集
Dept_1 <- as.factor(ABC$Dept)
Education_1 <- as.factor(ABC$Education)
BusinessTravel_1 <- as.factor(ABC$BusinessTravel)
之後,我已經將數據集分割爲列車和測試。列車和測試數據的數量似乎是完美的。然後我用GLM功能使用下面
fit = glm(attrition~Dept_1+Education_1+BusinessTravel_1,binomial(link="logit"),train)
擬合方程運行的語法,但它得到案件1470,而不是1028個記錄訓練集對整個數據集執行ABC。
無法理解問題所在。
dim(train)和dim(test)的結果是否正確? –
提到「data = train」...並且還顯示用於拆分的代碼 –