交互式處理佔用大量內存的列表對象

我最近發現了處理非常大的矩陣的包bigmemory，ff和filehash的奇觀。交互式處理佔用大量內存的列表對象

我該如何處理非常大的（300MB ++）列表？在我的工作中，我每天都在使用這些列表。我可以在任何地方使用save() & load()黑客進行創可貼解決方案，但我更喜歡類似bigmemory的解決方案。類似於bigmemorybigmatrix將是理想的，在那裏我使用它基本上與matrix相同，除了它在我的RAM中佔用660字節之類的字符。

這些列表大多是lm()對象（或類似的迴歸對象）的>1000長度列表。例如，

Y <- rnorm(1000) ; X <- rnorm(1000) 
A <- lapply(1:6000, function(i) lm(Y~X)) 
B <- lapply(1:6000, function(i) lm(Y~X)) 
C <- lapply(1:6000, function(i) lm(Y~X)) 
D <- lapply(1:6000, function(i) lm(Y~X)) 
E <- lapply(1:6000, function(i) lm(Y~X)) 
F <- lapply(1:6000, function(i) lm(Y~X))

在我的項目，我將有A,B,C,D,E,F型列表（甚至超過這個），我有交互工作。

如果這些是巨大的矩陣有一噸的支持。我想知道是否有任何對於大型list對象的包中有類似的支持。

來源

2012-09-25 Jase

您是否在尋求有關使用哪個軟件包的建議？ – GSee

顯得過於模糊，無法支持「最佳實踐」建議。描述這些「列表」的性質將是必要的。也許是數據庫接口之一。編碼建議需要更好的任務描述。 –

看看[SOAR]（http://cran.r-project.org/web/packages/SOAR/index.html）包吧？ – mnel

您可以使用filehash軟件包存儲和訪問磁盤上的列表。這應該工作（如果相當慢我的機器上...）：

Y <- rnorm(1000) ; X <- rnorm(1000) 

# set up disk object 
library(filehash) 
dbCreate("myTestDB") 
db <- dbInit("myTestDB") 

db$A <- lapply(1:6000, function(i) lm(Y~X)) 
db$B <- lapply(1:6000, function(i) lm(Y~X)) 
db$C <- lapply(1:6000, function(i) lm(Y~X)) 
db$D <- lapply(1:6000, function(i) lm(Y~X)) 
db$E <- lapply(1:6000, function(i) lm(Y~X)) 
db$F <- lapply(1:6000, function(i) lm(Y~X))

列表項可以使用[功能進行訪問。請參閱這裏瞭解更多詳情：http://cran.r-project.org/web/packages/filehash/vignettes/filehash.pdf

來源

2013-05-22 04:40:03 Ben

交互式處理佔用大量內存的列表對象

回答

相關問題