2016-03-03 33 views
-1

當使用numpy.histogram時,如果density = True,該函數將返回一個數組,其中每個點都有pdf值。但是我的問題是,它是否會返回垃圾箱前端或垃圾箱中間的pdf值?Numpy直方圖,哪一點是密度?

例如,如果我有垃圾桶0-1,1-2,2-3等......它會給我的點數0,1,2等......或在0.5,1.5, 2.5等...

謝謝!

回答

0

每個歸一化的直方圖值將給出您的樣本在其相應的邊緣邊界所跨越的範圍內的估計概率密度。如果您有垃圾箱邊緣ab那麼相應的歸一化直方圖值將是區間[a,b)上的概率密度。

直觀地說,要根據某些有限數量的樣本估計密度,可以計算落入每個直方圖箱的採樣數,然後除以箱的面積。對於無限多的樣本和無限小的箱子,這最終會聚合在基礎連續分佈的PDF上。

+0

對,我明白了。但是,至於哪個「更有意義」,在我看來,如果我試圖用這些箱密度來逼近pdf,那麼我將假設作爲一個點,這個密度被定義在箱右邊的中間? 也感謝您的答案。 –

+0

您的密度估計對於屬於同一個分檔的所有*分是不變的 - 它不僅僅是一個點估計。一般情況下,你可能會認爲它接近於靠近桶中心的點的真實概率密度(儘管我認爲在這種情況不成立的情況下也可以構造反例)。您可能還想查看[密度估算]的其他方法(https://en.wikipedia.org/wiki/Density_estimation),例如[KDE](https://en.wikipedia.org/wiki/Kernel_density_estimation) 。 –

+0

對,感謝您的幫助,我很感激。 –