0

對於4類分類問題,我有4個可用的分類器(已經過訓練)。對於給定的數據集,我有每個分類器的輸出,以及每個類的Recall,Precision和F1分數。根據F1分數合併分類器的輸出

考慮到某些分類器的f1分數比特定類的f1分數高,將哪些最佳算法(或可用的現有算法)合併爲這些分類器的預測以獲得單個最終預測?

編輯

我的主要問題是,一些分類有更好的F1特定類。

所以我們說Classifier1(C1)預測A類,並具有A級。然後Classifier2(C2)預測B類0.90 F1,並具有0.80的B類

我的第一個F1我們以爲會根據較高的f1選擇C1預測,但是如果我們也知道C2對於A類的f1得分爲0.999呢?如果C2對於預測A類(甚至優於C1)有好處,但沒有預測到,那麼這應該會增加真實類不是A的概率,我相信。

另一方面,如果C2對於A類的f1非常低,應該使它更有可能是真實的類是A,這不僅是因爲C1預測了A並且它很好,而且還因爲C2是不好預測,解釋爲什麼它可能未能檢測到它的類

我不知道如何在實踐中處理這些問題。

+0

需要更多的細節。這4個分類器是以一種方法還是全部方法進行工作的,即它們僅用於預測樣本是否屬於特定類別。或者他們都是單獨預測所有4個班級?一些示例代碼和數據輸入輸出將是首選。 –

+0

所有的分類器預測所有類別(我們正在討論不同的命名實體識別工具包,所以我不能提供代碼)。現在我只使用這些工具包的輸出,並且我希望有一些投票系統能夠通過以某種方式組合輸出來提高性能。我已經想出了一些有效的想法,我只是尋找一些可能存在的最先進的方法來做到這一點 –

+0

@VivekKumar我已經添加了一個具體情況的例子,試圖更好地解釋我在找什麼對於 –

回答

0

其中一種方法是進行等待投票,其中分數最高的f1分數的投票權重最高。然後,您只需選擇數量最高的班級。

+0

問題在於每個分類器對於每個類都有不同的F1。我用一個更具體的問題編輯了我的問題 –