R加速glm在應用函數

2016-04-27 78 views 0 likes

我的問題是基於以下情況：
我有一個20行和> 100,000列的矩陣。我想應用glm函數併爲每列提取似然比統計量。到目前爲止，我試圖以這種方式實施。例如：R加速glm在應用函數

X <- gl(5, 4, length = 20); Y <- gl(4, 1, length = 20) 
X <- factor(X); Y <- factor(Y) 
matrix <- matrix(sample.int(15, size = 20*100000, replace = TRUE), nrow = 20, ncol = 100000) 
apply(matrix, 2, function(x) glm(x ~ X+Y, poisson)$deviance)

有什麼辦法可以加快計算時間嗎？我認爲，因爲glm中使用的每個矢量都不大（矢量長度爲20），所以speedglm在這裏沒有幫助。

如果有人能給我這方面的建議，我會很高興。非常感謝您提前！

來源

2016-04-27 Quizzle123

回答

我跑了1000列的測試。它只花了2.4秒。

system.time(apply(matrix[,1:1000], 2, function(x) glm(x ~ X+Y, poisson)$deviance)) 

    user system elapsed 
    2.40 0.00 2.46

我也試過50,000，它似乎是非常線性縮放。

因此，您只需等待4分鐘即可計算100,000列。所以我沒有看到問題。但是，瓶頸是調用gbm（）函數100,000次的開銷。儘量避免多次運行高級功能。

要努力方面跑得更快，列出升序：

敷在並行循環（2X-4X倍加速）
弄明白來執行計算，如R矩陣乘法（〜50X）
與RCPP（實施〜100倍）

無解的將帶你不到4分鐘達到

來源

2016-04-27 11:25:57

相關問題

11. 如何預測在R中使用glm？
12. R glm（）不包括訓練數據集
13. 如何操作R中的GLM係數？
14. 加速查詢R data.table - 這個雙參數函數可以更迅速地按組應用嗎？
15. R返回從GLM cbind
16. 在R中應用兩次函數
17. 在R forloop中應用函數
18. 在R中應用成本函數
19. 應用R函數在Cpp與Rcpp
20. R在陣列上應用函數
21. 在R中應用西格馬函數
22. R：在列表中應用函數
23. 在R中加速gls？
24. 在多元分析中使用glm計算R平方R
25. PROC GENMOD在SAS VS中的R GLM
26. R：加速循環
27. 加速R循環
28. R編程：使用varfun指定glm族中的方差函數準
29. 在擬合R中的GLM模型時指定鏈接函數和'正常'族
30. 優化函數，用於加速應用程序