我有一個直方圖,其中我計算了函數在0.8和2.2範圍內取特定值的次數。一組值的累積分佈函數
我想獲得一組值的累積分佈函數。只計算直到每個特定值的事件總數纔是正確的。
例如,0.9處的cdf將是從0.8到0.9的所有事件的總和?
它是正確的嗎?
謝謝
我有一個直方圖,其中我計算了函數在0.8和2.2範圍內取特定值的次數。一組值的累積分佈函數
我想獲得一組值的累積分佈函數。只計算直到每個特定值的事件總數纔是正確的。
例如,0.9處的cdf將是從0.8到0.9的所有事件的總和?
它是正確的嗎?
謝謝
由項會給你CDF的估計,是數量標準化總和。它將和直方圖一樣準確地表示pdf。如果你想評估除垃圾桶端點以外的任何地方的垃圾桶,那麼包含一小部分垃圾桶的計數是有意義的,這樣如果你有斷點b_i和b_j,那麼在某個時間點評估垃圾桶的空間位置b_i < p < b_j你應該從相關單元格中添加計數分數(p_b_i)/(b_j-b_i)。基本上這是假定單元內密度均勻。 (基於你的問題,我不太清楚你有什麼權限,它的bin是在直方圖中還是在實際值中計數)。你可以從基礎值中獲得cdf的估計值。請注意,這樣做會在每個數據點上爲您的CDF不連續點(步驟),因此請考慮您是否有足夠的資源以及您使用CDF的內容,以確定這是否合適。作爲警告的最後一個注意事項,請注意,在觀測值範圍之外評估cdf會給出一個0或1的估計概率(對於x < 0.8爲零,對於x> 2.2爲1)。您應該考慮函數是否真的有界限,如果不是,則使用一些平滑來確保觀測值範圍之外的少量概率質量。