2014-04-15 39 views
4

我有一個範圍值如何查找R中的數字是否連續?

c(1,2,3,4,5,8,9,10,13,14,15) 

而且我想要找到其中的數字變得不連續的範圍。所有我想要的是作爲輸出:

(1,5) 
(8,10) 
(13,15) 

我需要找到斷點。

我需要在R.

+0

爲什麼(1,5)當您在1和5之間休息時預期輸出?你的價值中沒有4。 –

+0

已更改。只是一個疏忽。 –

+0

是的,我在Python中找到了一個解決方案,但是我在R中執行此操作。 –

回答

5

這樣的事情?

x <- c(1:5, 8:10, 13:15) # example data 
unname(tapply(x, cumsum(c(1, diff(x)) != 1), range) 
# [[1]] 
# [1] 1 5 
# 
# [[2]] 
# [1] 8 10 
# 
# [[3]] 
# [1] 13 15 

又如:

x <- c(1, 5, 10, 11:14, 20:21, 23) 
unname(tapply(x, cumsum(c(1, diff(x)) != 1), range)) 
# [[1]] 
# [1] 1 1 
# 
# [[2]] 
# [1] 5 5 
# 
# [[3]] 
# [1] 10 14 
# 
# [[4]] 
# [1] 20 21 
# 
# [[5]] 
# [1] 23 23 
4
x <- c(1:5, 8:10, 13:15)  
rr <- rle(x - seq_along(x)) 
rr$values <- seq_along(rr$values) 
s <- split(x, inverse.rle(rr)) 
s 
# $`1` 
# [1] 1 2 3 4 5 
# 
# $`2` 
# [1] 8 9 10 
# 
# $`3` 
# [1] 13 14 15 

## And then to get *literally* what you asked for: 
cat(paste0("(", gsub(":", ",", sapply(s, deparse)), ")"), sep="\n") 
# (1,5) 
# (8,10) 
# (13,15) 
+0

也許可以通過x-seq_along(x)分割而不是使用rle? – user20650

+1

@ user20650 - 問題是這樣的向量不安全:'x < - c(1:5,8:10,9:11)'。 (看看你在做split(x,x-seq_along(x))')時會得到什麼。 –

+0

啊我明白了,謝謝 – user20650

0

假設你不關心精確的輸出,並正在尋找每個範圍的最小值和最大值,您可以使用diff/cumsum /範圍如下:

x <- c(1:5, 8:10, 13:15) 
x. <- c(0, cumsum(diff(x)-1)) 

lapply(split(x, x.), range) 
1

我發表seqle將在一條線路爲你做這個。您可以加載包cgwtools或在代碼中搜索SO,因爲它已發佈了幾次。