在機器學習經歷一場革命的Turing lecture 2010Christopher Bishop會談,因爲被應用到機器學習算法統計...機器學習和統計數據有什麼區別?
但後來它像所有的機器學習算法都是統計算法..什麼兩者之間的真正區別?爲什麼他們在大多數大學裏分開課程?
在機器學習經歷一場革命的Turing lecture 2010Christopher Bishop會談,因爲被應用到機器學習算法統計...機器學習和統計數據有什麼區別?
但後來它像所有的機器學習算法都是統計算法..什麼兩者之間的真正區別?爲什麼他們在大多數大學裏分開課程?
這兩者之間沒有太大的區別,主要是文化。機器學習來自計算機科學的根源,而統計則更加數學。 Brendan O'Connor在博客文章"Statistics vs. Machine Learning, fight!"中討論了這個問題。對於機器學習的非統計方法,好幾種基於規則的方法(決策樹,規則歸納法,ILP),還有像強化學習這樣的控制問題的方法。對我而言,那些不是感覺非常統計,但是你可以聲稱他們是......如果你想要的話,你大概可以聲稱所有的生活都屬於統計決策理論(實際上,Marcus Hutter確實)。
統計數據基於一切概率模型。典型的分析首先假定你的數據是來自具有某種分佈的隨機變量的樣本,然後對分佈的參數進行推斷。
機器學習可能使用概率模型,當它發生時,它會與統計數據重疊。但機器學習並沒有如此致力於概率。它也願意使用其他方法解決問題,而不是基於概率。
我想我第一次看到「統計vs.機器學習,打架!」發佈我的鏈接在我的答案在您的博客:)順便說一句,這是很好的。 – Stompchicken 2010-11-17 17:18:29
此網頁上的維恩圖http://blogs.sas.com/content/subconsciousmusings/2014/08/22/looking-backwards-looking-forwards-sas-data-mining-and-machine-learning/聲稱統計和ML是分開的。根據這個你有什麼看法? – Aliweb 2015-03-18 11:46:11
我可以看到一些重要的區別:
#Scope:機器學習使用統計模型,但它也使用其他模型如動態編程,強化學習,來自人工智能或優化的技術。
#點的觀點:統計通常涉及估計量的性質(無偏性,漸近行爲),機器學習主要關注現實世界問題的解決方案。
#研究領域:雖然統計學可以看作應用數學的一個子領域,但機器學習可以被看作是計算機科學的一個子領域。
#CODE開發和應用:雖然誰與統計工作的人通常有R(或SAS,STATA,EVIEWS)一prefference,誰與機器學習工作的人通常會選擇的Python(或其他結構化編程語言)
統計學側重於數據分析的所有方面,如描述性,探索性,推論性,預測性和因果性。但是,機器學習只關注預測建模。
機器學習是
,可以從數據中學習,而不依賴於規則爲基礎的編程算法。
計算機科學和人工智能的一個子領域,涉及構建可以從數據中學習的系統,而不是明確編程的指令。
統計模型是在數學方程的形式變量之間的關係的
形式化。數學
子區與尋找變量之間的關係,預測結果
機器學習系統交易是真正的,如果它沒有被編程以執行任務的學習系統,但被編程學習執行任務。這是一個數據驅動的練習。現代機器學習不依賴於豐富的算法技術。幾乎所有這種機器學習形式的應用都基於深度神經網絡。這是我們現在稱之爲深度學習(Deep Learning)的領域,是機器學習的一門專業,常常應用於機器執行人工任務的弱人工智能應用。
決策樹在統計方面有着悠久的歷史,至少可以追溯到20世紀80年代初。他們有一個現成的解釋爲概率模型:如果您通過分裂節點從上至下擬合數據樹(相當於分割輸入空間),並且當您有<= * k *個點時停止分裂,則記錄類頻率這些點,而不是隻有大多數的類。那麼樹就是分類的概率分佈。 – 2014-10-23 20:44:28
這個網頁上的維恩圖http://blogs.sas.com/content/subconsciousmusings/2014/08/22/looking-backwards-looking-forwards-sas-data-mining-and-machine-learning/聲稱統計和ML是分開的。根據這個你有什麼看法? – Aliweb 2015-03-18 11:45:53