我想用這樣的數據集(與40K的意見),以評估在分對數迴歸變量的邊際效應:邊距軟件包命令花費太長時間運行
d1<- structure(list(dummy.eleito = c(1, 0, 0, 0, 0, 1, 1, 1, 1, 0),
dummy.tratamento = c(1, 1, 0, 0, 0, 0, 0, 0, 0, 0),
Escolaridade = c("SUPERIOR_INCOMPLETO", "FUNDAMENTAL_INCOMPLETO",
"SUPERIOR_COMPLETO", "FUNDAMENTAL_INCOMPLETO",
"SUPERIOR_COMPLETO", "SUPERIOR_COMPLETO", "SUPERIOR_INCOMPLETO",
"SUPERIOR_INCOMPLETO", "SUPERIOR_COMPLETO", "SUPERIOR_INCOMPLETO"),
Raca = c("Preta_Parda", "Preta_Parda", "Preta_Parda", "Preta_Parda",
"Preta_Parda", "Preta_Parda", "BRANCA", "BRANCA", "BRANCA", "BRANCA"),
DESCRICAO_SEXO = c("MASCULINO", "MASCULINO", "MASCULINO",
"MASCULINO", "MASCULINO", "MASCULINO", "MASCULINO",
"MASCULINO", "MASCULINO", "MASCULINO"),
votos.cidade = c(6483, 6483, 6483, 6483, 6483, 6483, 4735,
4735, 4735, 4735),
dummy.prefeito = c(0,1, 0, 0, 0, 1, 0, 0, 0, 1),
Intensidade.Trat0.Mun = c(0.0152671755725191, 0.0152671755725191, 0.0152671755725191, 0.0152671751,
0.0152671755725191, 0.01526717, 0.02857142856, 0.028571428, 0.028571, 0.0285714),
Var.Receitas = c(3.25607407, 11.424, 4.5549, -0.832116880227985, 5.78901737320675, -0.02459246,
1.151009, -0.3058719238, 0.742947247, -0.2711)),
.Names = c("dummy.eleito", "dummy.tratamento", "Escolaridade", "Raca",
"DESCRICAO_SEXO", "votos.cidade", "dummy.prefeito", "Intensidade.Trat0.Mun",
"Var.Receitas"), row.names = c(NA, 10L), class = "data.frame")
我運行使用glm:
model <- glm(dummy.eleito ~ dummy.tratamento + factor(Escolaridade) +
factor(Raca) + factor(DESCRICAO_SEXO) +
votos.cidade + dummy.prefeito +
dummy.tratamento:Intensidade.Trat0.Mun +
Var.Receitas + Var.Receitas:dummy.tratamento,
data = d1,
family = binomial(link = 'logit'))
然後我在某些點計算邊際效應:
m <- margins(model, at = list(dummy.tratamento = 1,
Intensidade.Trat0.Mun = fivenum(d1$Intensidade.Trat0.Mun)
Var.Receitas = fivenum(d1$Var.Receitas))
R
試圖通過整個晚上運行...在早上,仍然沒有。這是正常的嗎?任何可能的原因?數據是否太複雜?或者,也許迴歸公式本身?即使我運行margins
而不使用at
規範,它仍然不會。
任何幫助?
編輯:
更新R後,它的最新版本,這就是我到底得了:
使用整個數據集運行我需要的迴歸和margins
命令,R需要時間來完成這項工作,但最終確實如此。
但是,在margins
內使用參數at
時,問題仍然存在。我懷疑這是因爲迴歸具有factor
變量。我想我可能會使用我將放在at
命令中的參數來手動計算我的因變量的預測值,以便掌握結果。
歡迎任何建議的替代方案。
在你的問題中包括一個[最小可重現的例子](https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)將增加你獲得答案的機會。 – jsb
@jsb只包括一個與原始數據集的一小部分 –