2
我正在嘗試按照Mahout In Action書中所述在路透社數據上使用LDA的示例。但是,無論我運行多少次,我總是隻能得到一個主題。LDA Mahout只有一個主題
我跑的命令指示:
mahout lda -i reuters-vectors/tf-vectors -o reuters-lda-sparse -k 10 -v 34262 -x 20 -ow
我從運行seqdumper拿到了號。命令運行後,我運行LDAPrintTopics在書中指出,並得到如下:
Topic 0
===========
billion [p(billion|topic_0) = 0.04580929884162013
pct [p(pct|topic_0) = 0.043323700764985575
dlrs [p(dlrs|topic_0) = 0.031395871939373196
3 [p(3|topic_0) = 0.027311386657272094
1987 [p(1987|topic_0) = 0.025690077982656934
1 [p(1|topic_0) = 0.022727304049111215
reuter [p(reuter|topic_0) = 0.019572283708227903
mln [p(mln|topic_0) = 0.014569551610736616
april [p(april|topic_0) = 0.014453636611524965
march [p(march|topic_0) = 0.014359948846622552
有沒有辦法讓更多的話題了LDA的?
謝謝。