2016-09-04 46 views
2

我試圖解決概率代理從本書的一個簡單的棋盤遊戲AI的現代方法,但我有一些基本的數學問題,大部分是充分的共同分配,所以我要求提供一些指示。概率代理通過聯合概率分佈遍歷4x4網格世界

該板爲4×4平方 有1個怪物和2個凹坑在板 怪物和凹坑某處給出一個惡臭/微風在其相鄰的方塊賦予劑線索是否存在凹坑/怪物附近

間寫爲他們的座標網格上的元組:從1-4

(X,Y)例如:

房間(1,1),(1,2),(2,1)我們在房間裏發現了 微風(1,2)和(2,1)

這告訴我,有可能是在任一室的凹坑相鄰(1,2)和(2,1)

P是一個坑 該變量在4x4網格均勻分佈的概率(16間),所以我們得到0.2的概率,即每平方有一個坑或一個怪物

B是在被訪問房間是否有微風或惡臭(這意味着它是一個坑旁邊的概率他們更高

完整的聯合分佈應該是P(P11,...,P44,B11,B12,B21)

產品的規則給了我們

P(P11,...,P44,B11,B12,B21)=

P(B11,B12,B21 | P11,...,P44)P(P11,...,P44)

Product Rule on Full Joint Distribution

到目前爲止好,但在這裏,我似乎無法採取下一步行動。

我的第二個術語是它的均勻分佈概率爲0.2以上的房間。 但第一學期應該有1個,如果微風房間(B21和B12)與一個坑/怪物相鄰。但是B的數字是多少?我怎麼得到這個? AIMA書中指出:「第一項是微風配置的條件概率分佈,給定了坑配置;它的值是1,如果微風與坑相鄰,否則爲0「

我一直在掙扎着這幾天,沒有取得進展。任何幫助,將不勝感激。

+1

「......均勻地在一開始的4×4格(16間)分佈,所以我們得到的0.2的概率,有一個坑或每平方怪物」。我是否錯過了某些東西,或者這個概率是3/16 = 0.1875? – kabdulla

+0

我在這裏有點困惑。 P11可能會採取什麼樣的價值觀?根據(1,1)是否包含坑/獸,它是0還是1?使隨機變量輸出成爲坑的實際位置似乎更自然一些,而不是爲世界上的位置創建一個二元的是/否隨機變量。你能夠鏈接到你正在使用的教科書中的問題嗎? – eigenchris

+2

我同意這是超級混亂。自從'英雄'在其中一個方格中出現後,它的3/15因此從開始3/15 = 0.2中只有15個是未知的。我試圖在羅素和諾維格的「人工智能現代方法」一書中重新創建第4頁第13.6章。它看起來很簡單,但我無法理解它。 「對於具有恰好n坑,(。P1,1,...,P4,4)P = 0.2的特定配置^ N×0.8^16-n中。」(諾維格,P500) – Fred

回答

1

Bxy值是在細胞xy中是否觀察到微風的指標。他們正式定義爲:

BXY當且僅當在(X,Y),
BXY觀察到微風= 0,否則

所以,在你的榜樣的情況,我們已經知道= 1即類似地,變量P11,P12,...,P44也是二元變量,其中Pxy = 1當且僅當在單元格中存在凹坑時P11 = 0,B12 = 1,B21 = 1

(x,y)。

我們看看這第一個任期內,我相信這是你的問題是關於,你不明白的東西是什麼:

P(B11,B12,B21 | P11。 ..,P44)

這是使觀測(B11,考慮到有位於小區(X凹坑B12,B21),y),其中Pxy的= 1

在的條件概率分佈在示例情況下,您可以填寫B11,B12和B21的值。你知道B11 = 0,B12 = B21 = 1(因爲這是觀察到的)。你不知道坑在哪個位置,所以你不能直接填寫你的情況Pxy值。但是,您可以可以填寫任何可以想到的任意情況的值。

你可以說:「好吧,讓我們假設只有在位置的坑(1,3)」。然後我們有P13 = 1,和所有其他Pxy的= 0。對於這樣的具體情況,也可以計算的特定情況下發生的(這將是0的概率,因爲你不能看到在微風(2 ,1)如果(1,3)中只有一個坑)。

如果你重複這個對所有可能的情況下,你可以想像,你可以結合的結果變得更加有趣的答案,比如有是在某個位置一個坑,給你提出的意見的可能性。這就是下文所述的內容,但我相信這不再是你的問題所在。