使用GAM適合的因子水平下降

我使用GAM模型根據給定點的某些環境條件來預測物種丰度。我創建了一個廣義相加模型（GAM）來做到這一點，並根據我的預測。然而，在模型方程中我有一個分類變量（沉積物 type = [1,2,3,4]）。該方程似乎工作得很好，但擬合的結果似乎吸收因子水平'1'進入截距。見下文。使用GAM適合的因子水平下降

任何人都可以解釋這個模型發生了什麼？我不完全明白。這是用mgcv包在R中運行的。謝謝！

Equation:    
abundance ~ s(x) + s(y) + s(z) + s(w) + factor(Sediment) 
Parametric coefficients: 
Estimate Std. Error z value Pr(>|z|) 

(Intercept) ------------_7.138 ----- 0.000 ------7541.26 2e-16 
     factor(Sediment)2 -0.2496868 0.0016749 -149.08 2e-16 
     factor(Sediment)3 -0.5128687 0.0058931 -87.03 2e-16 
     factor(Sediment)4 -0.1467369 0.0034606 -42.40 2e-16 

Approximate significance of smooth terms: 
       _________ _edf Ref.df Chi.sq p-value  
s(x) 3.983  4 69264 2e-16 
s(y) 3.998  4 1147536 2e-16 
s(z) 3.995  4 197458 2e-16 
s(w) 3.999  4 340085 2e-16

來源

2012-06-12 michael drexler

看來我無法投票將其作爲stats.stackexchange.com上的問題的重複來關閉。然而[there]（http://stats.stackexchange.com/q/26539/5055）。 – joran

截距表示沉積物類型1的平均丰度，因爲這將是參考水平（第一水平）。估算值是其他沉積物類型的係數，代表該類型與參考水平（沉積物類型1）的偏差。

這是一個在模型中帶有因子變量的標準約定;如果模型中有截距，則不能將其表示爲和的每個因子級別，因爲模型矩陣的結果列將相互線性相關 - 您可以使用至少一列較少的列表示相同的信息在模型矩陣中。

如果需要，可以通過在公式中添加- 1來刪除截距，但我在這裏沒有看到這樣做的理由。

來源

2012-06-12 17:29:25

雖然在公式中添加「-1」應該會導致更多的SO或SE問題。 –

@DWin ???你的意思是在統計上解釋這樣一個模型？是的我同意;由於西蒙伍德制定的GAM上的所有可識別性約束條件，我只會選擇信任他並保持截取。 –

我想這會引發更多關於R中對比的解釋的問題。我並沒有特別想到GAM的情況。 –

使用GAM適合的因子水平下降

回答

相關問題