我目前正在努力處理一個非常不平衡的數據集,其中有9個類,最多和最少表示類之間的比例爲12:1。應用weka的SMOTE過濾器,直到所有類別都具有同等代表性,從分類結果的總體分類準確率86%到分類準確率95%,大大改善了分類結果。在應用SMOTE過濾器之前,單個類別準確度(真正的正面)也普遍得到改善,它們在94%-99%之間應用SMOTE過濾器後在40%-99%之間。因此,精度隨着SMOTE濾波器的應用次數而增加。WEKA的SMOTE過濾器 - 如何解釋結果
這些「新」結果有多可靠?這可能是更多的過度合適的影響?