我正在使用我從Oracle數據庫下載的非常大的數據集。數據框有大約21百萬行和15列。 我的操作系統是Windows XP(32位),我有2GB內存。短期而言,我無法升級我的內存或操作系統(它在工作中,需要幾個月的時間才能獲得體面的電腦)。在R中使用非常大的數據集
library(RODBC)
sqlQuery(Channel1,"Select * from table1",stringsAsFactor=FALSE)
我在這裏已經與通常的「無法分配xMb到矢量」卡住了。 我發現了一些關於使用ff
軟件包的建議。我希望知道是否有人熟悉ff軟件包可以告訴我這是否對我有幫助。 你知道解決內存問題的另一種方法嗎? 64位解決方案有幫助嗎? 感謝您的建議。
可如果數據架構允許你可以把表中的hbase或hadoop在csv格式,並嘗試R在地圖減少時尚?看到Rhadoop – FUD
以每小時2美元的價格從亞馬遜租一臺電腦,[這些好人](http://www.bioconductor.org/help/bioconductor-cloud-ami/)爲你設置了所有的工作。 – Chase