我試圖用最大似然估計來檢查某些合成數據集中冪律的存在。我遵循this paper中描述的方法。在這種方法中,將一個觀察向量x提供給代碼,然後代碼告訴給定數據將來自冪律分佈的置信度(p值)。對於單個數據集,這非常簡單。但是,現在我正在嘗試使用相同的代碼來處理稍微不同的情況。所以我對某個進程進行了很多(比如說100次)隨機模擬,並且每次都給我一個長度爲1000的向量x。然後,我對所有這100個實現的分佈進行平均,以找到平均值x,其分佈看起來大致與對數日誌情節。要使用上面的代碼找到p值,我必須輸入與平均分佈相對應的觀測值向量。但是,在這裏我遇到了問題。起初,我只是將平均分佈乘以1000,並將該產品的最接近的整數作爲觀察某個值的頻率。但是,有時在100個實現中很少有一個發生某個值,然後當我構建向量時,相應的值完全不顯示。因此,我放棄了分佈尾部的所有價值。有沒有更好的方法來計算這種平均分佈的p值來檢驗冪律假設?測試合成數據的冪律假設
0
A
回答
0
因此,總結一下,您試圖從百次數據實現中找到最合適的數據?由於數據的模擬我想象噪音在所有模擬中都是不變的,而且每個模型的數字都是相同的,所以每個實現都具有相同的權重?在這種情況下,將它們集合在一起並根據參數計算每個x的y值(假設您只是將功率圖轉換爲y = mx + c)m和c,並根據樣本中的噪聲提出問題,那麼概率是多少的模擬值。對所有x一起重複這些,然後重複m和c的不同值(可能要看吉布斯採樣)。然後,您可以使用m和c的值,從而給出最高的概率。
相關問題
- 1. 冪律分佈擬合
- 2. Python擬合多項式,冪律和指數數據
- 3. 如何找到合適的冪律?
- 4. 冪律KS檢驗
- 5. 用於計算冪律擬合
- 6. 蟒蛇情節和冪律適合
- 7. Scipy.optimize.curve_fit不適合餘弦冪律
- 8. Python:如何生成冪律圖
- 9. 冪律()`的`包功能fitdistrplus`
- 10. 用於擬合網絡度數分佈的冪律的輸入
- 11. Gamma校正@冪律變換
- 12. 如何使冪律函數線性化?
- 13. 在R/Python中擬合指數方法/漸近冪規律
- 14. Python:從冪律分佈生成隨機數
- 15. R - 用x和y數據繪製冪律線
- 16. 基於原始數據創建冪律分佈圖
- 17. 如何使用moq生成假數據進行單元測試?
- 18. 冪律曲線擬合scipy,numpy不工作
- 19. 多個冪律圖與包PoweRlaw
- 20. 在mongodb中設置虛假數據進行測試
- 21. 生成在C冪律分佈並用蟒
- 22. 如何使用Python估計指數截斷冪律的參數?
- 23. 自動化單元測試的DbContext和集成測試假貨
- 24. Python:用指數截點繪製冪律函數
- 25. 估計冪律分佈的指數截斷
- 26. 使用MathNet在C#中給定指數的冪律分佈
- 27. 產生冪律分佈的隨機數發生器?
- 28. R中的NLS和對數週期冪律(LPPL)
- 29. 如何使用Python估計冪律分佈的指數?
- 30. 非結構化p2p網絡的冪律指數是多少?
我投票結束這個問題作爲題外話,因爲這個問題是關於統計 – csgillespie