2016-11-17 27 views
0

我的問題與這篇文章Document topical distribution in Gensim LDA有關,gensim.models.ldamodel的文檔聲明「minimum_probability控制過濾爲文檔返回的主題(弓)」。然而,ldamodel [語料庫]以其概率返回所有可能的主題(甚至低於minimum_probability中設置的數量)。這兩者有什麼區別? 蟒蛇2.7.5 gensim 0.13.3gensim潛在Dirichlet分配minimum_probability與print_topics

謝謝

+0

在http://stackoverflow.com/a/36967532/5031727中提出了類似的問題,但與評論不同,ldamodel [語料庫]生成的id和主題的元組低於最小概率中設置的值。 – valearner

回答

0

我的the documentation理解是minimum_probability可以是模型生成(適用於事後所有查詢)兩者的參數和查詢界面,例如get_document_topics(bow, minimum_probability=None, ....)。所以除非你使用minimum_probability參數model[doc_bow]進行訓練,否則不會按概率修剪。