1
我正在尋找使用Mallet按我定義的主題對不同文檔進行分類。我知道Mallet會首先確定主題,然後對文檔進行分類,但是我想跳過第一步,因爲我已經有一個主題列表以及與它們相關的單詞。有沒有辦法使用我創建的用Mallet對文檔進行分類的預定義主題列表?使用Mallet中的預定義主題
任何指導表示讚賞。謝謝!
我正在尋找使用Mallet按我定義的主題對不同文檔進行分類。我知道Mallet會首先確定主題,然後對文檔進行分類,但是我想跳過第一步,因爲我已經有一個主題列表以及與它們相關的單詞。有沒有辦法使用我創建的用Mallet對文檔進行分類的預定義主題列表?使用Mallet中的預定義主題
任何指導表示讚賞。謝謝!
如果您正在進行無監督學習(沒有訓練實例,即每個主題的文檔),則無法簡單地設置主題。重點是訓練算法事先不知道關於文檔的任何信息。它只是試圖根據您提供的功能分離/分發它們。
如果您正在進行有監督的學習,主題實際上是課程,並且您有每個課程的文檔。然後該算法嘗試瞭解哪些功能對每個類都有重要意義。在槌子你應該使用分類模塊。
可能有一些奇特的主題建模思路,它根據特定的關鍵字合併/歪曲主題分佈,但我認爲Mallet並不可能。