我想了解LDA主題模型如何在槌子API中實現。在ParallelTopicModel
類中,我可以看到一個稱爲typeTopicCounts
的2D int數組,它在buildInitialTypeTopicCounts()
方法中通過一些按位操作初始化,並稍後用於每個文檔。我的問題是這個數組值意味着什麼?我只能從源代碼中獲得的信息是它被[特徵索引,主題索引]索引。typeTopicCounts功能的主題建模實施槌子API
0
A
回答
0
針對LDA的吉布斯採樣的計算性能主要是通過計算每個詞標記的主題抽樣分佈。話題模型被設置爲在話語和話題之間具有很多稀疏的關係。如果我們可以通過從一個詞到下一個詞節省儘可能多的計算並且只做有意義的計算(比如不乘以零)來使得計算更有效率,那麼我們可以獲得很大的加速。
每個單詞類型在typeTopicCounts
數組中有一個int
s的數組。這個數組中的每個int
值的含義使用位移運算符編碼兩個一個話題和一個令牌計數。計數值位於高位,因此我們可以按「計數」對主題進行排序,而無需「解包」整數。從這個方法的教程
幻燈片都可以在這裏:
https://mimno.infosci.cornell.edu/slides/fast-sparse-sampling.pdf
相關問題
- 1. 使用槌子建模的主題
- 2. 木槌主題建模
- 3. 木槌主題建模 - 主題鍵輸出參數
- 4. 無法運行槌主題模型
- 5. 實施flatMap功能
- 6. 主題建模槌:如何解釋相對熵
- 7. 如何實施和使用的子模式從System.Console.CmdArgs功能
- 8. 實施FSEEK()功能的功能
- 9. C:實施rownames的功能
- 10. 建模功能的問題
- 11. 實施閃光燈功能
- 12. 實施非會員功能
- 13. 實施「IntBitsToFloat」功能在VB.NET
- 14. AR模型格子實施
- 15. R主題建模:lda模型標註功能
- 16. 問題實施模型
- 17. 覆蓋子主題中的父主題功能?怎麼樣?
- 18. 禁用wordpress子主題功能
- 19. 如何實施YouTube的評論功能?
- 20. 實施Excel的小計功能
- 21. 搜索功能的Django項目實施
- 22. 實施 「UP」 按鈕的功能
- 23. 用模式匹配或功能的組合物實施revmap功能
- 24. 實施Rails的API
- 25. 實施主題4個應用
- 26. 內置功能在哪裏實施
- 27. 實施版本控制功能
- 28. 在計劃中實施「收集」功能
- 29. 難度實施NSUndoManager重做功能
- 30. 推斷與槌主題,使用保存的話題狀態