我正在計算操作過程中的許多(〜1億個)浮點值。我不想將它們都存儲在內存中,但我想保存該集合的粗略分佈。在不保存單個值的情況下存儲概率分佈
我的想法是確定所有值的指數並在直方圖中對它們進行計數。但是,這當然只在數值有不同的指數時才起作用。
有沒有人知道我怎麼能做到這一點,而不知道分佈是怎樣的?
我正在計算操作過程中的許多(〜1億個)浮點值。我不想將它們都存儲在內存中,但我想保存該集合的粗略分佈。在不保存單個值的情況下存儲概率分佈
我的想法是確定所有值的指數並在直方圖中對它們進行計數。但是,這當然只在數值有不同的指數時才起作用。
有沒有人知道我怎麼能做到這一點,而不知道分佈是怎樣的?
如果您大致瞭解最小值和最大值,我認爲分箱策略將是一個不錯的選擇。這裏是我的意思大綱:
弄清楚你多少箱需要 我所有的數字 發現,這個數字進去 增加段
它-the飛分佈的時間,然後再重建PDF取決於你願意做得多糟糕。另外,你有沒有關於價值範圍的想法?他們都在0到100萬之間嗎? –