什麼是最有效的方法,使R中滯後變量的對任意可變的矩陣(即,不是一個固定的時間系列)滯後變量
例如:
輸入 :
x <- c(1,2,3,4)
2滯後,輸出:
[1,NA, NA]
[2, 1, NA]
[3, 2, 1]
[4, 3, 2]
什麼是最有效的方法,使R中滯後變量的對任意可變的矩陣(即,不是一個固定的時間系列)滯後變量
例如:
輸入 :
x <- c(1,2,3,4)
2滯後,輸出:
[1,NA, NA]
[2, 1, NA]
[3, 2, 1]
[4, 3, 2]
可以使用達到這個內置embed()
功能,其中它的第二個「尺寸」的說法就相當於你「VE所謂的 '滯後':
x <- c(NA,NA,1,2,3,4)
embed(x,3)
## returns
[,1] [,2] [,3]
[1,] 1 NA NA
[2,] 2 1 NA
[3,] 3 2 1
[4,] 4 3 2
embed()
由約書亞帝國在previous answer討論。 (請注意,我用NAs前綴x來複制所需的輸出)。
它不是特別有名,但對於涉及滑動窗口的操作(例如滾動平均值和移動平均值)非常有用且功能強大。
在gtools
包中的running
功能也或多或少你想要什麼:
> require("gtools")
> running(1:4, fun=I, width=3, allow.fewer=TRUE)
$`1:1`
[1] 1
$`1:2`
[1] 1 2
$`1:3`
[1] 1 2 3
$`2:4`
[1] 2 3 4
但詹姆斯想要一個矩陣不是列表。您可以使用矩陣(unlist(...))打包結果,但embed()函數只需一步即可完成。 – 2009-08-23 05:56:07
完全正確,這就是爲什麼我upvoted的embed()解決方案,當它出來=)。但是,「跑步」仍然是一個有用的功能 - 大多數時候,當我想要創建詹姆斯要求的矩陣時,我真正想要做的就是運用它。 – 2009-08-23 16:46:01
最適合我的方法 是使用dplyr
包中的lag
函數。
例子:
> require(dplyr)
> lag(1:10, 1)
[1] NA 1 2 3 4 5 6 7 8 9
> lag(1:10, 2)
[1] NA NA 1 2 3 4 5 6 7 8
更一般地說: lagmatrix < - function(x,max.lag){embed(c(rep(NA,max.lag),x),max.lag + 1)} 然後使用lagmatrix(1:4,2 ) – 2009-08-23 05:58:10
感謝您指向嵌入函數的指針。這爲我節省了大量的計算時間。 – 2009-08-27 15:17:33