1

我想使用Mallet作爲專家查找項目的一部分。我幾乎是馬利特的新手,但我知道它從一組文檔中培養主題。假設我有50個由Mallet培訓的主題。我想計算這個概率:p(topic|q)或者p(q|topic)如何獲得使用Mallet查詢的主題概率

q是查詢。這是一個詞(如算法,機器人等),我希望找到指定區域的專家。

當我讀到這篇文章:how to get word-topic probability using mallet,其中一位用戶說我們可以使用--word-topic-counts-file選項來計算概率。假設我已經通過Mallet生成了這個文件。它具有以下結構:

0 android 2:21 
1 is 3:3 
. 
. 
. 

我知道這個語義結構的,但我不知道我該怎麼計算的話題給出的查詢的概率(即p(topic|q)或任p(q|topic)

PS:我用的是「不是」,因爲我不知道槌計算它們中的哪

任何幫助,將不勝感激

回答

0

拿這個例子專線GlieBrt's answer to the linked question

1 needham 19:2 17:1 

這裏P(主題| q)的可被計算爲

P(19 |尼德姆)= 2/3 = 0.67

P(17 |尼德姆)= 1/3 = 0.33

有了你自己的例子,它是更簡單:

0 android 2:21 

p(2 | android)= 1.0

+0

謝謝,我真的被困在這個問題上 –