2015-11-30 290 views
0

這裏是我的問題,我希望你能幫助我:貝葉斯推理

比方說,我們生活在一個只有兩個類別的世界裏,每個有一些功能。這個世界中的物體是這些特徵的不同排列。

CAT1:{A,B,C,d,E,F}

CAT2:{G,H,I,J}

現在我們有具有這些特徵的對象:

OBJ:{A,b,C,d,G,H}

什麼是這個對象被分類爲Cat.1概率? p(cat1 | a,b,c,d,g,h)?

通常如何可以用於方程模型:每次用不同數量的特徵 n個種類,具有不同的排列對象?

回答

0

您可以使用貝葉斯分類器來計算這些概率。爲了適應正態分佈,因爲它是貝葉斯分類器最常用的分佈,請參閱this link。但是,要使用此解決方案,您需要假設每個對象持有價值爲您的所有功能,例如:

obj1:{a=1, b=1, c=1, d=1, e=0, f=0, g=1, h=1, i=0, j=0} 

注意,特徵值必須計算的分佈參數之前進行歸一化。

+0

謝謝阿里!你會從概念上幫助我嗎?我的問題是我不能將它構造成手動來理解它。例如,在這種特定情況下,可能性和先驗概率是什麼?我在這個基本的水平... – Barbaletta

+0

讓我們來舉一個例子吧。考慮我們有兩個類別:M =男性和F =女性。現在我們要訓練一個貝葉斯分類器,對於一個新的觀察,X告訴我們P(C = M | X)和P(C = F | X)的概率。正如你所知,條件概率可以寫成P(C = M | X)= P(M)* P(X | C = M)/ P(X)= Prior * Likelihood/Evidence。考慮我們的功能是這樣定義的:重量,高度,語音頻帶寬度等。您需要有一個火車數據庫,這意味着已經從您的世界觀察到的數據。例如,你已經看到1000人700男性和300女性。 – Alireza

+0

然後,先驗概率將是P(M)= 700/1000和P(F)= 300/1000。 要計算可能性,您需要將我的鏈接分配給您觀察的數據庫。閱讀樸素貝葉斯分類器的維基百科頁面,這很好。 – Alireza