,這個問題很相似,這個帖子Splitting a data frame into a list using intervals一個data.frame,但答案並不適用於我的數據,因爲我沒有與二進制值的列。分割使用間隔
我的數據是這樣的:
>df
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11
1 chr1 49828662 49828663 rs7531656 0 +|chr1 48998526 50489626 AGBL4 1 -
2 chr1 62594676 62594677 rs2481665 0 +|chr1 62208148 62629591 PATJ 1 +
3 chr1 62633580 62633581 rs2457831 0 +|chr1 62208148 62629591 PATJ 1 +
4 chr1 66379767 66379768 rs12757124 0 +|chr1 66378927 66840262 PDE4B 1 +
5 chr1 66392060 66392061 rs55824844 0 +|chr1 66378927 66840262 PDE4B 1 +
6 chr1 66393984 66393985 rs35185259 0 +|chr1 66378927 66840262 PDE4B 1 +
我需要的是分裂基於列V2
並在5e+05
區間的文件,輸出會是這樣的
[[1]]
1 chr1 49828662 49828663 rs7531656 0 +|chr1 48998526 50489626 AGBL4 1 -
[[2]]
2 chr1 62594676 62594677 rs2481665 0 +|chr1 62208148 62629591 PATJ 1 +
3 chr1 62633580 62633581 rs2457831 0 +|chr1 62208148 62629591 PATJ 1 +
[[3]]
4 chr1 66379767 66379768 rs12757124 0 +|chr1 66378927 66840262 PDE4B 1 +
5 chr1 66392060 66392061 rs55824844 0 +|chr1 66378927 66840262 PDE4B 1 +
6 chr1 66393984 66393985 rs35185259 0 +|chr1 66378927 66840262 PDE4B 1 +
我的數據有〜5millions行,所以速度會是一個問題,但後來我可以對付它
'split'上'cut' – alistaire