機器學習分類器（LG，SVM和決策樹）的主要假設

在經典統計中，人們通常陳述假定的假設（即數據的正態性和線性，數據的獨立性）。但是當我閱讀機器學習教科書和教程時，基本的假設並不總是明確或完全陳述。對於二元分類，以下ML分類器的主要假設是什麼？哪些對於堅持不是很重要以及哪些必須嚴格堅持？機器學習分類器（LG，SVM和決策樹）的主要假設

Logistic迴歸
支持向量機（線性和非線性核）
決策樹

來源

2016-02-16 KubiK888

IID是幾乎所有的統計學習方法的基本假設。

Logistic迴歸是GLM（廣義線性模型）的特例。因此，儘管有一些技術要求，但最嚴格的限制在於數據分佈的具體分佈。數據必須在指數族中分佈。您可以在https://en.wikipedia.org/wiki/Generalized_linear_model中深入瞭解，而斯坦福大學CS229講義1也有很好的關於此主題的報道。

SVM對輸入數據非常寬容，尤其是軟邊距版本。我記不起任何具體的數據假設（請更正）。

決策樹講述了與SVM相同的故事。

來源

2016-02-16 01:55:51 RogerChern

機器學習分類器（LG，SVM和決策樹）的主要假設

回答

相關問題