2017-03-15 29 views
-3

我有很多年的大數據。我想分別使用R分別來自每年的數據。我該如何拆分r中的數據?

REC_NUM YEAR LOC2 REP TRT PLOT# HYBRID FEMALE MALE Combine GWAS LO_CODE KC %M MwVOL MwFSH 
95384 1996 B02 1 167 1026 HW109R 75-514 71-760 75-514-71-760 X 8 81 16.5 3275 1 
95414 1996 B02 2 167 2167 HW109R 75-514 71-760 75-514-71-760 X 8 83 15.2 3300 1 
95387 1996 B05 1 212 1052 HW109R 75-514 71-760 75-514-71-760 X 8 82 15.4 3175 1 
95415 1996 B05 2 212 2011 HW109R 75-514 71-760 75-514-71-760 X 8 88 15.8 3075 1 
95361 1996 B06 1 37 1005 HW109R 75-514 71-760 75-514-71-760 X 2 92 15.2 3275 1 
95391 1996 B06 2 37 2024 HW109R 75-514 71-760 75-514-71-760 X 2 76 15.3 3300 1 
95389 1996 B07 1 236 1150 HW109R 75-514 71-760 75-514-71-760 X 9 98 16 3350 1 
95417 1996 B07 2 236 2082 HW109R 75-514 71-760 75-514-71-760 X 9 74 14.5 3450 1 
95373 1996 B08 1 57 1013 HW109R 75-514 71-760 75-514-71-760 X 7 78 16.3 3250 1 
95402 1996 B08 2 57 2017 HW109R 75-514 71-760 75-514-71-760 X 7 89 15.8 3400 1 
95364 1996 B10 1 41 1040 HW109R 75-514 71-760 75-514-71-760 X 4 85 15.5 3125 1 
95371 1996 B10 1 45 1039 HW109R 75-514 71-760 75-514-71-760 X 4 79 15.1 3325 1 

從1996年到2011年的數據並不平衡。這意味着不同年份的REC_NUM(第一列)不同。我如何使用r? 由於事先

+1

請參閱'?split' ... – Gregor

回答

1

由於@Gregor提到:由「不均衡」

df <- data.frame(YEAR = c("2001","2001","2002","2002"), REC_NUM = c(95384, 95414, 95387, 95415)) 
split(df, f = df$YEAR) 

不知道你是什麼意思。

+0

感謝您的指導。我期待分裂命令,我做了如下h < - read.table(file.choose(),header = T).... s < - split(h,h $ YEAR).... SO,現在怎麼樣我可以獲得單獨的文件嗎?每個文件包含一年的數據。 –

+0

「不平衡」意味着我每年有不同的行 –

+0

您可以使用's1 < - s [[1]]'手動執行或使用'lapply' [http://stackoverflow.com/questions/9713294/split-data-frame-based-of-a-factor-into-new-data-frames] –