我有(多類)訓練數據,其中的類是通過聚合手形標記的數據來學習的,因此某些行將具有[0,0,0, 0.4,0.6]。無論如何要直接將它用作分類器的訓練數據。我寧願不求助於學習5個迴歸模型,或者只是將這些數據設置爲[0,0,0,0,1]。兩者似乎都比直接學習更糟糕。至少我知道這應該可以用於邏輯迴歸,但是沒有api似乎支持它。 (另外我寧願使用比這更好的分類器。)是否有可能從類概率中學習分類器(在sklearn中)
0
A
回答
1
這是一個依賴於模型的問題。特別是 - 如果您想要使用SVM進行此類任務,您需要K SVMa,其中K =標籤數量(因爲SVM是二元模型,而不是因爲您想使用概率)。一旦你做到了,你可以使用「樣本權重」來包含你所談論的這種知識。所以對於SVM,答案是是,這是可能的,而且很容易做到。特別是scikit-learn可以實現每個樣本的權重。
它也可以自然的方式納入樸素貝葉斯。
在不同的模型中,它可能更復雜,例如你可以訓練神經網絡與期望輸出[0,0,0,0.4,0.6]而不是二進制向量,但這可能會導致過度擬合(因爲這樣做並不意味着「4類確實爲40%」,而是「試圖用這種方式建模,利用這個樣本你準確回答[0,0,0,0.4,0.6]」,所以如果有類似的樣本它有[0,0,0,1,1]它會嘗試區分它們,這同樣適用於任何多元迴歸方法
1
目前還沒有估算器支持這個。這是完全可能的,例如對於一個隨機森林或決策樹,這與學習一個迴歸模型沒有多大區別(不確定什麼是一個很好的分裂的cri儘管如此)。
我不認爲我們會在短時間內獲得一個API。不過,您可以修改隨機森林,最近鄰居或神經網絡(即將推出)來處理此設置。
通過一些工作,您可能也可以更改SGDClassifier,但是您說您不需要線性模型。你認爲什麼是「更好」的分類器?
相關問題
- 1. python sklearn分類器使用的概率分佈是什麼
- 2. 二元機器學習分類的置信概率
- 3. 概率和機器學習
- 4. 什麼是可能的學習庫給多類分類標籤的概率分數?
- 5. 如何使用scikit通過概率分類學習SVC?
- 6. Opencv中的概率分類器
- 7. 機器學習概率基本
- 8. 加快sklearn /機器學習與醃菜分類任務?
- 9. Azure機器學習分類
- 10. 是否可以計算任何類型分類器的後驗概率?
- 11. SciKit-從ODBC中學習文本分類
- 12. 機器學習,分類類型
- 13. 在有監督學習中提取分類功能
- 14. Scikit學習分類
- 15. Weka在分類器中的概率分佈
- 16. 是否有可能改變corona SDK中選擇的概率?
- 17. SKLearn多類分類器
- 18. 機器學習分類器AdaBoost for C#
- 19. 機器學習 - 分類器評估
- 20. 是否有可能#include在C++類中?
- 21. 是否有可能在派生類中
- 22. Python分類器Sklearn
- 23. Scikit學習 - 如何繪製概率
- 24. 哪個WEKA分類器的概率?
- 25. 是NN分類輸出概率?
- 26. 如何從MultilayerPerceptronClassifier獲取分類概率?
- 27. 來自訓練過的sklearn中樹節點的預測分類概率DecisionTreeClassifier
- 28. 是否有可能從部分類型生成嚴格類型?
- 29. 機器學習概述
- 30. sklearn NB分類器:如何獲得單個樣本的實際概率?
查看我對[這個問題] [1]的回答。 [1]:http://stackoverflow.com/questions/19221289/how-to-do-text-classification-with-label-probabilities/19224727#19224727 –