2016-11-10 155 views
1

我用sklearn和gensim應用了lda。然後我檢查了數據的困惑。SKlearn LDA與Gensim LDA的困惑對比問題

我對gensim的困惑和對於sklearn perpleixy的正面價值有越來越多的價值。我如何比較這些值。

sklearn困惑= 417185.466838

gensim困惑= -9212485.38144

+0

你是如何獲得這兩個困惑? – MMF

+0

@MMF在sklearn中: - lda.perplexity(doc_test)和gensim: - ldamodel.bound(doc_test) – MachoMan

回答

0

爲了比較,你需要使用np.exp(-1. * gensim_model.log_perplexity(train_corpus))轉換gensim的困惑困惑。

有關Gensim和Sklearn LDA實現的一般比較,請參見here