我使用scikit-learn軟件包中的LASSO來優化懲罰線性迴歸問題的參數。我不僅對參數的最佳選擇感興趣,而且對數據關於優化參數的可能性感興趣。裝修後是否有一種簡單的方法來獲得完全可能性?LASSO適合scikit-learn - 獲得可能性
回答
在最大可能框架下考慮lasso
有點欺騙。先前的係數分佈是一個拉普拉斯分佈exp(-np.prod(np.abs(coef)))
,它只在最優時產生稀疏度作爲「僞像」。從這個分佈中獲得一個稀疏樣本的概率是0(它發生「幾乎從不」)。
本免責聲明的方式進行,你可以寫
import numpy as np
from sklearn.linear_model import Lasso
est = Lasso(alpha=10.)
est.fit(X, y)
coef = est.coef_
data_loss = 0.5 * ((X.dot(coef) - y) ** 2).sum()
n_samples, n_features = X.shape
penalty = n_samples * est.alpha * np.abs(coef).sum()
likelihood = np.exp(-(data_loss + penalty))
對不起,延遲迴復。我需要一些時間來思考我的問題,然後才能對答案給出有用的反饋。我目前的問題是,阿爾法包含兩個參數:正態分佈的方差和先驗的擬合參數的「緊密度」。 – cel
參數'alpha'只調節權重上的「之前」。你指的是哪種正態分佈?殘差的分佈?因爲根據這個「先驗」,權重不是正態分佈 – eickenberg
據我的理解:後驗是N(y | mu = y_hat,sigma^2)* La(w_t,mu = 0,τ)。第一項屬於普通線性迴歸,其中y是觀測值的向量,y是所看到的數據和權重(正態分佈)的線性組合的向量。第二項是拉普拉斯之前。 Alpha與sigma^2/tau成正比。在優化權重時,西格瑪和頭不是那麼重要,組合術語α調節正則化的強度。我目前的問題是,我認爲我需要西格瑪和頭都計算完整的後驗。 – cel
- 1. refactory可能做得不合適
- 2. 獲得各種可能的組合列
- 3. 有可能獲得逆相關性?
- 4. 可能無法獲得柔性
- 5. Lasso和FileMaker 13
- 6. Kivy Android Scikitlearn
- 7. Lasso Python中的廣義線性模型
- 8. 畫布尺寸是否適合性能?
- 9. 獲得更好的性能
- 10. 獲得AWS AMI性能
- 11. 如何使用Pandas和SciKitLearn Stack提高Python腳本的性能?
- 12. glmnet lasso ROC圖表
- 13. 如何使用高斯模型的混合來獲得可能性
- 14. 融合適應基類有可能嗎?
- 15. 需要消耗消息才能獲得高可用性
- 16. 哪個CSS代碼片段更適合可維護性和性能
- 17. 活動或片段哪個更適合用於性能和可靠性?
- 18. 如何結合這些查詢以獲得更快的性能?
- 19. 如何從C#中獲得合理的性能WebClient UploadString
- 20. XNA - 合併精靈以獲得更好的繪圖性能?
- 21. 如何獲得更多合併文件的性能
- 22. 我在哪裏可以獲得javax.persistence屬性的完整集合
- 23. 如何獲得聚合物domHost屬性?
- 24. 如何獲得WCF性能指標?
- 25. 如何獲得多維數組的所有可能組合
- 26. 如何獲得所有可能的組合在Array
- 27. 獲得所有可能的x布爾組合(球拍,方案)
- 28. 可能獲得更多的控制權合併在Github For Windows?
- 29. oracle sql在表中獲得所有可能的組合
- 30. 在vb.net中獲得數組數組的所有可能組合
你所說的*優化參數的意思是*?關於什麼指標?預測分數? – eickenberg