2016-02-16 59 views
2

在經典統計中,人們通常陳述假定的假設(即數據的正態性和線性,數據的獨立性)。但是當我閱讀機器學習教科書和教程時,基本的假設並不總是明確或完全陳述。對於二元分類,以下ML分類器的主要假設是什麼?哪些對於堅持不是很重要以及哪些必須嚴格堅持?機器學習分類器(LG,SVM和決策樹)的主要假設

  • Logistic迴歸
  • 支持向量機(線性和非線性核)
  • 決策樹

回答

1

IID是幾乎所有的統計學習方法的基本假設。

Logistic迴歸是GLM(廣義線性模型)的特例。因此,儘管有一些技術要求,但最嚴格的限制在於數據分佈的具體分佈。數據必須在指數族中分佈。您可以在https://en.wikipedia.org/wiki/Generalized_linear_model中深入瞭解,而斯坦福大學CS229講義1也有很好的關於此主題的報道。

SVM對輸入數據非常寬容,尤其是軟邊距版本。我記不起任何具體的數據假設(請更正)。

決策樹講述了與SVM相同的故事。