的OP寫道:
我如何糾正呢?我想所有的概率都應該稍微低估,如果它沒有通過正確的觀點。
這是不正確的。低估某些價值(如攔截)並高估其他價值是完全可能的。
一個例子以下的情況:
真正的概率:
set.seed(444)
true_prob <- function(x) {
# logit probabilities
lp <- (x - 0.5)
# true probabilities
p <- 1/(1 + exp(-lp))
p
}
true_prob(x = 0.5)
[1] 0.5
但是,如果您模擬數據和擬合模型,攔截可能被低估和其他價值高估:
n <- 100
# simulated predictor
x <- runif(n, 0, 1)
probs <- true_prob(x)
# simulated binary response
y <- as.numeric(runif(n) < probs)
現在擬合模型並比較真實概率與合適概率:
> true_prob(0.5)
[1] 0.5
> predict(m, newdata = data.frame(x = 0.5), type = "response")
1
0.479328
> true_prob(2)
[1] 0.8175745
> predict(m, newdata = data.frame(x = 2), type = "response")
1
0.8665702
因此,在這個例子中,模型低估了在x = 0.5和x = 2時
我嘗試這樣高估,但它給了其結果是P [是= 0.5]當X約0.55。此外,X開始時高於P [是],稍後「開啓」。我知道P [是]應該總是高於X,除非X = 0.5。 – MLEN
這是否可以這樣做,因爲X只取0.5和1之間的一個值?將嘗試明天和我的代碼獲取一部分數據。 – MLEN
看起來很奇怪。我看不出'X'的範圍會與它有什麼關係。 [mcve]肯定會有用。 –