4
我對從數據集中提取的1000多個樣本進行多次邏輯迴歸運行。我的問題是展示我的結果的最佳方式是什麼?我如何繪製適合度和預測曲線的輸出?爲邏輯迴歸繪製多個擬合和預測
這是我正在做的一個例子,使用R的棒球數據集。例如,我想擬合和預測模型5次。每次我拿出一個樣本(用於預測)並使用另一個樣本進行擬合。
library(corrgram)
data(baseball)
#Exclude rows with NA values
dataset=baseball[complete.cases(baseball),]
#Create vector replacing the Leage (A our N) by 1 or 0.
PA=rep(0,dim(dataset)[1])
PA[which(dataset[,2]=="A")]=1
#Model the player be league A in function of the Hits,Runs,Errors and Salary
fit_glm_list=list()
prd_glm_list=list()
for (k in 1:5){
sp=sample(seq(1:length(PA)),30,replace=FALSE)
fit_glm<-glm(PA[sp[1:15]]~baseball$Hits[sp[1:15]]+baseball$Runs[sp[1:15]]+baseball$Errors[sp[1:15]]+baseball$Salary[sp[1:15]])
prd_glm<-predict(fit_glm,baseball[sp[16:30],c(6,8,20,21)])
fit_glm_list[[k]]=fit_glm;prd_glm_list[[k]]=fit_glm
}
哪裏是「棒球「數據集? – 2013-04-28 16:39:19
@ A.R你是什麼意思的「顯示我的結果」?繪製預測的分佈?繪製殘差?繪製其他迴歸診斷?還有別的嗎? – pteetor 2013-04-28 16:50:25
@pteetor繪製預測和殘差的分佈 – 2013-04-28 16:55:43