我想對SVC
分類器的概率輸出運行網格搜索交叉驗證。特別是我想盡量減少負對數的可能性。從文檔看來,GridSearchCV
稱爲predict()
方法的估計器通過,而SVC
的方法返回類別預測而不是概率(predict_proba()
返回類別概率)。sci-kit學習SVC概率輸出的網格搜索交叉驗證
1)我是否需要繼承SVC
的子類並給它返回概率而不是類來實現我的對數似然交叉驗證的方法?我想我需要寫我自己的score_func
或loss_func
?
2)交叉驗證這個負對數似然啞嗎?我正在做這件事b/c數據集是:a)不平衡的5:1和b)根本不可分開,即使「最差」的觀察者也有50%的機會進入「好」類。 (可能還張貼在統計q &一本第二個問題)
1)謝謝,2)它是好的,如果最終的估計仍然是少數類的樣本產生> 0.5。事實上,我很確定它會,我只是希望這些概率儘可能「好」。 – user1507844
似乎它需要'超級(ProbSVC,self)'(即參數順序相反),但我對Python很陌生,所以如果有人確認這個 – user1507844
@ user1507844會更喜歡:你說得對,對不起那。 –