對於分類問題,通常如何確定網絡的輸出?解釋神經網絡輸出
假設有三個可能的類,每個類都有一個數字標識符,合理的解決方案是對輸出進行求和並將該和作爲網絡的總輸出?或者你會拿出網絡輸出的平均值?
關於ANN理論有很多信息,但沒有太多關於應用的信息,但是如果這是一個愚蠢的問題,我會支持。
對於分類問題,通常如何確定網絡的輸出?解釋神經網絡輸出
假設有三個可能的類,每個類都有一個數字標識符,合理的解決方案是對輸出進行求和並將該和作爲網絡的總輸出?或者你會拿出網絡輸出的平均值?
關於ANN理論有很多信息,但沒有太多關於應用的信息,但是如果這是一個愚蠢的問題,我會支持。
對於具有3類的多層感知器分類器,通常構造具有3個輸出的網絡並訓練網絡,使得(1,0,0)是第一類的目標輸出,(0,1, 0)爲第二類,(0,0,1)爲第三類。爲了分類新的觀察結果,通常選擇具有最大值的輸出(例如,(0.12,0.56,0.87)將被歸類爲第3類)。
我主要贊同bogatron,並且你會在這裏找到很多關於神經網絡這種「多類分類」的建議。
關於您的標題,我想補充一點,您可以將該輸出解釋爲概率,因爲我努力爲此找到理論基礎。繼續我將討論在輸出層中有3個神經元的神經網絡,爲相應的類指示1。 由於訓練中所有三個輸出的總和總是1,所以神經網絡也將給出前饋輸出的總和爲1(相當於(0.12 0.36 0.52)(比例如bogatrons))然後你可以將這些數字解釋爲相應輸入屬於1/2/3類(概率爲0.52,屬於類3)的概率)。
使用logistic函數或tanh作爲激活函數時,這是正確的。
更多內容:通過神經網絡 後驗概率:http://www-vis.lbl.gov/~romano/mlgroup/papers/neural-networks-survey.pdf
How to convert the output of an artificial neural network into probabilities?
只是爲了澄清關於我使用的示例輸出 - 一般來說,除非在輸出層中執行了標準化(我沒有做出這個假設),否則網絡輸出不會加到一。如果他們是正常化的,那麼正如你所說的那樣,輸出可以被解釋爲概率。關於@ VisionIncision關於產出總和/均值的問題,如果產出被歸一化,那麼總和和平均值將沒有意義(總和將總是1,平均值總是1/3)。 – bogatron 2013-02-15 22:07:24
規範化的東西也是有道理的,但在某個地方我有這樣的想法,它是一個經過訓練的神經網絡固有的,因爲在人工神經網絡中學習總是1 [0,0,1]/[1,0,0 ]等等。另一方面,爲什麼NN_not_不知道輸出總和總是1? – fanfabbb 2013-02-16 08:21:58
你通常訓練網絡的目標是訓練的全部零點和一個單一的輸出(對應於正確的類),但是錯誤不能總是減少到零(即使可以,總是希望它,因爲你可能會過度適應你的解決方案)。還回想一下,邏輯函數(也稱爲sigmoid)在負和正無窮大處僅具有0或1的輸出,這在實踐中是我們永遠不會看到的。 – bogatron 2013-02-16 14:07:21
感謝您的答覆。一個新的觀察結果到底是什麼意思?謝謝。 – 2013-02-15 18:57:57
未用於訓練網絡的觀察結果。 – bogatron 2013-02-15 18:58:36
啊,我明白了,謝謝。 – 2013-02-15 19:00:40