2016-12-07 45 views
-1

我具有以下的輸入數據:大規模數據Logistic迴歸

head(data1) 
       VarA VarB VarC   VarD VarE VarG VarH VarI 
2016-06-01 09:30:05 14.2 31228 ABCD IS Equity 1 139 192 23 
2016-06-01 09:30:07 14.2 31128 ABCD IS Equity 0  0  0 0 
2016-06-01 09:30:09 14.2 36128 ABCD IS Equity 1 138 192 23 
2016-06-01 09:30:19 14.2 36028 ABCD IS Equity 0  0  0 0 
2016-06-01 09:30:21 14.2 27028 ABCD IS Equity 1 112 190 23 
2016-06-01 09:30:37 14.2 26528 ABCD IS Equity 0  0  0 0 

VarAPOSIXct是類型,VarDchr類型的,並且是restsnum類型。

VarE是我的因變量。 VarC, VarB, VarG, VarH and VarI是我的解釋變量。數據集的總行數爲7.4 million。我想運行邏輯迴歸。我試過bigglmbiglm包使用binomial family。但它是failing to converge。由於我沒有得到適當的偏差值。所以我有問題計算McFadden's R-Sqr值相同。你可以請建議任何替代包/方式?

在此先感謝。

+0

Downvote ??我可以知道爲什麼嗎?如果可能的話,請給我解釋一下,這樣下次我可以小心了。 – Zico

回答

0

sgd軟件包將允許您通過隨機梯度下降方法逐個樣本地處理數據。

+0

謝謝,我試過了。雖然它已經成功地融合在一起,但它提供的信息非常有限。你能從這個唯一的信息分享一些關於僞R-Sqr計算的信息嗎?我只能看到這些信息:模型,係數,收斂,估計,位置,時間,model.out。 – Zico