2015-10-29 40 views
-1

我有以下數據集:MATLAB中的歸一化直方圖不正確?

X=[4.692 
    6.328 
    4.677 
    6.836 
    5.032 
    5.269 
    5.732 
    5.083 
    4.772 
    4.659 
    4.564 
    5.627 
    4.959 
    4.631 
    6.407 
    4.747 
    4.920 
    4.771 
    5.308 
    5.200 
    5.242 
    4.738 
    4.758 
    4.725 
    4.808 
    4.618 
    4.638 
    7.829 
    7.702 
    4.659]; % Sample set 

我嵌合的Pareto分佈此使用最大似然方法和我得到下面的圖:

enter image description here

在哪裏的以下位代碼是什麼繪製直方圖:

[N,edges,bin] = histcounts(X,'BinMethod','auto'); 
bin_middles=mean([edges(1:end-1);edges(2:end)]); 
f_X_sample=N/trapz(bin_middles,N); 
bar(bin_middles,f_X_sample,1);; 

我正在做這個權利?我檢查了100次,帕累託分佈確實是最佳的,但它似乎與直方圖有很大的不同。有沒有可能導致此錯誤?謝謝!

+2

嘗試手動增加倉的數量,而不是使用'auto'標誌 – tashuhka

+0

好,會在我的電腦試試這個。雖然你的建議不是「人造」的嗎? –

回答

1

我會@ tashuhka的評論,你需要想想你如何裝箱的數據相一致。

想象的極端情況下,你都混爲一談連成一片紙槽,然後嘗試在單點適合的分佈。你的PDF看起來不像你的單個方形條。分成兩個箱,現在依然適合很爛,但至少有一個酒吧(可能)比其他的,等等,等等。大一點在另一個極端,每一個數據點擁有自己的酒吧和條形圖只有一個點數的酒吧隨機森林。

有用於choosing an "optimal" bin size最小化窗口的數量,但最大化底層PDF的表示了一些不同的策略。

最後要注意,你只有30點在這裏,所以你的其他問題可能是,你只是還沒有收集到足夠的數據,真正敲定底層PDF。

+0

箱數越來越多,謝謝! –

相關問題