2012-09-14 29 views
0

我該如何擺脫離散數據集中的閃爍數據,但採用「平滑」的方式?擺脫樣本數據中的峯值

就拿

enter image description here

有兩種火花,在20000,但在600下一個也被認爲是一個火花。

我已經成功地得到了非常高的人到零,通過

a = 2 
b = 5 
beta_dist = RealDistribution('beta', [a, b]) 
f(x) = x/19968 
normalized_insertions = [f(i) for i in insertions] 

insertions_pairs = [(i, beta_dist.distribution_function(i)) for i in normalized_insertions] 
plot_b = beta_dist.plot() 

show(list_plot(insertions_pairs)+plot_b) 

不知道如何去低的。最大值應該達到100,也許beta分佈的參數需要更多一些?

目前,它看起來像這樣: enter image description here

如果可能的話,使用鼠尾草作爲你解釋的參考。

+1

您可以使用中值過濾器,也許3或5分。 –

+0

您是否在尋找進行數據平滑的方法?如果是這樣,那麼應用Paul R建議的中值濾波器就可以實現。此外,您究竟想用這些數據來衡量,您爲什麼選擇使用beta版本? – xvtk

+0

@PaulR我很樂意接受你的回答,如果你這樣發佈的話。 – Flavius

回答

1

您可以使用median filter,也許3或5分。這將刪除上面數據中的孤立異常值。