2
我有一個模型生成的功能lda.collapsed.gibbs.sampler,從lda包,我需要知道頂部的「相關性」話。 當使用lda.collapsed.gibbs.sampler模型和頂級單詞排名
top.topic.words(result$topics, 10, by.score=TRUE)
我得到的前10個字每個主題的列表,但我想看到的題目的百分比的10個字代表。我猜這些信息是存在的,因爲有一個「分數」,但我對吉布斯採樣器的統計方法並不十分熟悉。
提前致謝!
你能澄清你的話題的百分比是什麼意思?你的意思是這個話題中的任何一個詞出現的概率是多少?或者可能是這些主題詞對的Gibbs分配的一部分? –
第二個,我想。我想知道這個詞在這個話題中有多重「重量」。我不太確定那個正式表達式爲:( –