我想用遺傳程序(gp)來估計'事件'的'結果'的概率。爲了訓練nn我正在使用遺傳算法。使用遺傳程序來估計概率
所以,在我的數據庫我有很多的活動,包含多種可能的結果每一個事件。
我會給GP一組涉及到每個事件每個結果輸入變量。
我的問題是 - 應該適應度函數是在GP是什麼????
例如,現在我給gp一組輸入數據(結果輸入變量)和一組目標數據(如果結果DID發生則爲1,如果結果DID不發生則爲0,使用適應度函數是產出和目標的均方誤差)。然後,我得到每個結果的每個輸出的總和,並將每個輸出除以總和(給出概率)。然而,我確信這不是正確的做法。
爲了清楚起見,這是我目前如何這樣做:
我想估計在事件發生5個不同結果的概率:
Outcome 1 - inputs = [0.1, 0.2, 0.1, 0.4]
Outcome 1 - inputs = [0.1, 0.3, 0.1, 0.3]
Outcome 1 - inputs = [0.5, 0.6, 0.2, 0.1]
Outcome 1 - inputs = [0.9, 0.2, 0.1, 0.3]
Outcome 1 - inputs = [0.9, 0.2, 0.9, 0.2]
我會再計算出GP輸出對於每個輸入:
Outcome 1 - output = 0.1
Outcome 1 - output = 0.7
Outcome 1 - output = 0.2
Outcome 1 - output = 0.4
Outcome 1 - output = 0.4
此事件中每個結果的輸出總和爲:1.80。然後我會通過總和除以輸出計算每個結果的「可能性」:
Outcome 1 - p = 0.055
Outcome 1 - p = 0.388
Outcome 1 - p = 0.111
Outcome 1 - p = 0.222
Outcome 1 - p = 0.222
開始之前 - 我知道,這些都不是真正的概率,並且這種方法是行不通的!我只是把它放在這裏來幫助你理解我想要達到的目標。
誰能給我我如何能估計每個結果的概率一些指點? (另外,請注意我的數學是不是很大)
非常感謝
我不明白你描述的問題。你的數據集究竟是怎樣的?它是如何產生的?你究竟想要估計什麼? – ziggystar
我正在嘗試估計事件中發生結果的概率。一個事件可以是任何事情(例如一場比賽),結果可以是任何事情(例如跑步者)。 gp的輸入將是與每個參賽者相關的變量,並且我試圖估計每個參賽者贏得比賽的概率。 – Sherlock
因此,你的'事件'不是[概率意義上的'事件'](http://en.wikipedia.org/wiki/Event_%28probability_theory%29),而是「事情發生」常見含義的事件?這很混亂。那麼你是否試圖估計某個事件給定結果的條件概率? – ziggystar