我想使用Mallet作爲專家查找項目的一部分。我幾乎是馬利特的新手,但我知道它從一組文檔中培養主題。假設我有50個由Mallet培訓的主題。我想計算這個概率:p(topic|q)
或者p(q|topic)
如何獲得使用Mallet查詢的主題概率
q
是查詢。這是一個詞(如算法,機器人等),我希望找到指定區域的專家。
當我讀到這篇文章:how to get word-topic probability using mallet,其中一位用戶說我們可以使用--word-topic-counts-file
選項來計算概率。假設我已經通過Mallet生成了這個文件。它具有以下結構:
0 android 2:21
1 is 3:3
.
.
.
我知道這個語義結構的,但我不知道我該怎麼計算的話題給出的查詢的概率(即p(topic|q)
或任p(q|topic)
)
PS:我用的是「不是」,因爲我不知道槌計算它們中的哪
任何幫助,將不勝感激
謝謝,我真的被困在這個問題上 –