3
A
回答
8
當您使用木槌建立主題時,您可以選擇一個名爲「--word-topic-counts-file」的選項。當您提供此選項並指定一個文件時,木槌會在文件的每一行中寫入(主題,詞語,概率)值。你可以稍後用C,Java或R(當然,任何語言)閱讀這個文件來創建你想要的矩陣。
2
只是爲了說明Praveen的答案。使用 「--word話題-數文件」 MALLET將創建一個文件,其中排第幾是這個樣子:
0伊麗莎白19:1
1李約瑟19:2 17:1
死亡2例19:2
3母17:1 19:1 14:1
其中第一行表示該單詞伊麗莎白一直存在的主題19曾經在;第二行意味着單詞needham與主題19相關聯兩次,並且主題17一次;依此類推。
雖然這個文件並沒有給出明確的概率,但可以用它來計算它們。
+0
當您計算概率時,您還需要包含alpha值。我不完全確定,但我相信計算將如[本評論]中所述(http://stackoverflow.com/questions/33251703/how-to-get-a-probability-distribution-for-a-話題在-槌#comment69702638_33251703)。 – senderle
相關問題
- 1. 如何獲得每個主題的概率槌
- 2. 木槌主題建模
- 3. 如何讓主題的詞的概率槌
- 4. 如何獲得使用Mallet查詢的主題概率
- 5. 如何使用木槌提取主題關鍵短語
- 6. 如何在木槌中使用--use-ngrams
- 7. 木槌下載問題
- 8. 木槌主題建模 - 主題鍵輸出參數
- 9. 如何使用scikit學習獲取特定文檔的主題概率?
- 10. hLDA的木槌推理器
- 11. 使用槌子建模的主題
- 12. 木槌構圖文件中的null-sources
- 13. 如何獲得gensim LDA中給定單詞的主題詞概率?
- 14. 如何從text2vec獲取主題概率表LDA
- 15. 如何使用matplotlib獲得密度/概率圖
- 16. 如何使用libsvm獲得概率輸出
- 17. R中的LDA和主題建模 - 主題,單詞和概率
- 18. 如何獲得使用的確切文字利潤率由TextRenderer
- 19. 推斷與槌主題,使用保存的話題狀態
- 20. Facebook謎題(概率)
- 21. WEKA + Java的:獲得類的概率
- 22. ř獲得的概率分佈
- 23. 以概率獲得隨機數
- 24. BotFramework:獲得IntentDialog的概率分數
- 25. NLP:計算一個文檔屬於一個主題的概率(用一包字)?
- 26. 概率使用rand.Next()
- 27. bin /槌球訓練主題在每種情況下獲得不同的結果
- 28. 無法運行槌主題模型
- 29. 使用與槌
- 30. 如何獲得Qt的CPU使用率
你能告訴你迄今爲止試過的東西嗎? – bump
什麼試圖得到?你想要一個文檔的頂級主題,還是一個主題的頂級單詞,還是兩者的混合? – bean5