2013-01-23 35 views
0

我對lda-c-dist軟件包的推理結果有疑問。在查看推斷結果時應該顯示多少單詞?例如,如果我將單詞數設置爲非常大的N(假設所有單詞的數量都是N),它似乎存在一些單詞組。在每組中,字的索引是範圍從1到N.關於Blei的推理結果lda-c-dist

什麼我很喜歡, 假定術語的數目是10,並且我顯示分配至10

Topic 0xx: 
001 
008 
009 
002 
003 
007 
000 
004 
005 
006 
單詞的數目

看起來,可能是我應該設置的字顯示3,而不是10.

因此,對於一個主題,當通過調用topics.py查看主題時,應該指定多少個單詞?

此外,我將使用此輸出來計算兩個主題的相似度。所以...

回答

0

實際上,可以有多少個詞彙表。此處顯示的內容只是表示有限數字的概率降序。