2017-04-16 57 views
0

假設我們有一個隨機採樣分佈,我們可以計算和繪製相關ECDF如下:確定跳躍在經驗分佈

set.seed(1) 
t1 <- rnorm(10000,mean=20) 
t1 <- sort(t1) 
t1[1:1000] <- t1[1:1000]*(-100) 
t1[1001:7499] <- t1[1001:7499]*50 
t1[7500:10000] <- t1[7500:10000]*100 
cdft1 <- ecdf(t1) 
plot(cdft1) 

現在,在這種情況下,有跳躍(意向創建)在經驗分配。跳躍我的意思是,它增加了很多,比方說超過100%的價值。這發生在位置7,500的示例中。我的問題是:如何最有效地找到這些「跳躍」指數?

回答

2

只需查看排序後的t1值的diff,即可接近您想要的值。

St1 = sort(t1) 
which(diff(St1) > abs(St1[-length(St1)])) 
[1] 1000 7499 

在點1000,St1的切換從-1632.8700至934.6916,這在技術上滿足你的 「超過100%的變化」 的標準。當我發現像這樣的符號變化時,我不明白什麼是想要的。