0
我有一個大型的溫度數據集(csv),我必須按日期(年)進行子集化,以便每十年創建5個較小的數據集。因此,從1960-1969年的數據將是一個較小的csv文件,1970-1979年的數據將是另一個csv文件等。我一直試圖使用for循環執行此操作R使用for循環從一個大型csv文件中創建較小的csv文件
所以如下所示:
IDs<-unique(df$ID)
for (i in 1:length(IDs)){
temp <- df[df$ID==IDs[i],]
#more things to do with temp
}
但我不確定如何去做這件事。 for循環應該創建新的csv文件,這些文件是按照現有大型數據集中的日期進行子集化的。
請提供[可重現的示例](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)。 –
對於大型數據集,可以看一下'data.table'包,對於快速讀取,可以使用'fread()'函數。 – jogo
您可以使用'cut'來創建分組變量,然後用該組分割數據集。 – akrun