我遇到了一些與我的數據有關的問題,需要一些幫助。 我試圖運行有/無變量作爲響應變量和幾個解釋變量(時間,地點,存在/缺勤數據,丰度數據)的glm分析。R - 二元響應模型中的分離問題 - glm,brglm,logistf
首先,我試圖使用GLM()函數,但是我有關於glm.fit()2個警告: 1:glm.fit:算法沒有收斂 2:glm.fit:嵌合概率數值0或發生了1次 經過一番調查後,我發現問題很可能是準完全分離,因此決定使用brglm和/或logistf。
logistf:分析不運行 當運行logistf()我得到一個錯誤消息說:在chol.default(X) 錯誤: 導致未成年人39不是正定 我看着logistf包手冊,在互聯網上,在Heinze和Ploner的理論和技術論文中找不到這個功能的用途,以及錯誤是否可以通過一些設置來解決。
brglm:分析運行 不過,我得到一個警告消息說: 在fit.proc(X = X,Y = Y,重量=砝碼,開始=啓動,etastart#= etastart,: 迭代達到上限 就像之前我找不到在哪裏,以及爲什麼在運行包使用此功能,並通過調整一些設置,如果可固定。
在更普遍的方式,我想知道是什麼的根本區別這些包。
我希望這有道理,如果這是一種我不知道的統計證據,我很抱歉。
這是我第一次問一個問題,所以我很抱歉,如果它不是應該的,請你毫不猶豫地讓我知道它。
謝謝您的幫助
Xochitl C.
這裏我表的提取物(我必須截斷行的長度,因爲該表是太寬:20列)和我運行的公式不同:
head()
Year Quarter Subarea Latitude Longitude Presence.S CPUE.S Presence.H CPUE.H Presence.NP
1 2000 1 31F1 51.25 1.5 0 0 0 0 0
2 2000 1 31F2 51.25 2.5 0 0 0 0 0
3 2000 1 32F1 51.75 1.5 0 0 0 0 0
4 2000 1 32F2 51.75 2.5 0 0 0 0 0
5 2000 1 32F3 51.75 3.5 0 0 0 0 0
6 2000 1 33F1 52.25 1.5 0 0 0 0 0
tail()
Year Quarter Subarea Latitude Longitude Presence.S CPUE.S Presence.H CPUE.H
4435 2012 3 50F3 60.75 3.5 1 103.000 1 110.000
4436 2012 3 51E8 61.25 -1.5 1 1311.600 1 12.000
4437 2012 3 51E9 61.25 -0.5 1 34.336 1 46.671
4438 2012 3 51F0 61.25 0.5 1 430.500 1 148.000
4439 2012 3 51F1 61.25 1.5 1 115.000 1 85.000
4440 2012 3 51F2 61.25 2.5 1 72.500 1 5.500
logistf_binomPres <- logistf (Presence.S ~ (Presence.BW + Presence.W + Presence.C + Presence.NP +Presence.P + Presence.H +CPUE.BW + CPUE.H + CPUE.P + CPUE.NP + CPUE.W + CPUE.C + Year + Quarter + Latitude + Longitude)^2, data = CPUE_table)
Brglm_binomPres <- brglm (Presence.S ~ (Presence.BW + Presence.W + Presence.C + Presence.NP +Presence.P + Presence.H +CPUE.BW + CPUE.H + CPUE.P + CPUE.NP + CPUE.W + CPUE.C + Year + Quarter + Latitude + Longitude)^2, family = binomial, data = CPUE_table)
@moderator考慮這一點移動到stats.stackexchange.com? – 2014-12-13 19:47:26