我是R和FF包的新手,並且試圖更好地理解FF如何讓用戶使用大型數據集(> 4Gb)。我花了相當多的時間在網上搜尋教程,但我能找到的那些通常會超出我的頭腦。使用FF包創建和重塑R中大數據的函數
我在做的最好,所以作爲一個練習,我想知道如何使用任意值創建一個長格式的時間序列數據集,類似於R的內置「Indometh」數據集。然後我想將它重新整理成寬版。然後我想將輸出保存爲csv文件。
對於小數據集,這是簡單的,並且可以使用下面的腳本來實現:
##########################################
#Generate the data frame
DF<-data.frame()
for(Subject in 1:6){
for(time in 1:11){
DF<-rbind(DF,c(Subject,time,runif(1)))
}
}
names(DF)<-c("Subject","time","conc")
##########################################
#Reshape to wide format
DF<-reshape(DF, v.names = "conc", idvar = "Subject", timevar = "time", direction = "wide")
##########################################
#Save csv file
write.csv(DF,file="DF.csv")
但我想學會大約10 GB的文件大小做到這一點。我將如何使用FF包來做到這一點?提前致謝。
謝謝你的有用答案。 – Luke23