2015-11-21 35 views
0

我有一個大型的溫度數據集(csv),我必須按日期(年)進行子集化,以便每十年創建5個較小的數據集。因此,從1960-1969年的數據將是一個較小的csv文件,1970-1979年的數據將是另一個csv文件等。我一直試圖使用for循環執行此操作R使用for循環從一個大型csv文件中創建較小的csv文件

所以如下所示:

IDs<-unique(df$ID) 
for (i in 1:length(IDs)){ 
    temp <- df[df$ID==IDs[i],] 
    #more things to do with temp 
} 

但我不確定如何去做這件事。 for循環應該創建新的csv文件,這些文件是按照現有大型數據集中的日期進行子集化的。

+2

請提供[可重現的示例](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)。 –

+1

對於大型數據集,可以看一下'data.table'包,對於快速讀取,可以使用'fread()'函數。 – jogo

+1

您可以使用'cut'來創建分組變量,然後用該組分割數據集。 – akrun

回答