2

正如this article中所解釋的那樣,計算F-1得分(也就是計算召回和精確度)時,這些計算是基於正面還是負面的分類很重要。例如,如果我有一個含有1%A類標籤和99%B類標籤的傾斜數據集,並且我將A分配給了正面類別並將所有測試項目分類爲正數,那麼我的F-1分數將會非常好。如何告訴scikit-learn在二元分類中哪些類別是正面類別? (如果有幫助,我可以提供代碼。)如何告訴scikit-learn給出了F-1 /精確度/召回得分的標籤(二進制分類)?

回答

3

對於二元分類,sklearn.metrics.f1_score默認會假設1是正類,0是負類。如果您使用這些約定(類別B爲0,類別A爲1),它應該會給您所需的行爲。可以通過將pos_label關鍵字參數傳遞給f1_score函數來覆蓋此行爲。

請參閱:http://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html

+0

非常感謝。 –

+0

也謝謝你的回答。但是,是否有任何官方文件的參考? –

+0

閱讀手冊頁http://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html,'pos_label'默認爲1作爲肯定的類,但它可以被覆蓋。 –

相關問題