0
EM軟聚類在Lingpipe的EM教程,他們說,這是可能的運行沒有監督數據的算法:在lingpipe
有可能通過具有初始分類訓練在一個完全無監督形式的分類隨機分配類別。只有類別的數量必須確定。算法是完全一樣的,收斂後的結果或最大數量的時期是一個分類器。
但是他們的班級TradNaiveBayesClassifier
需要標記和未標記的語料庫運行。我怎樣才能修改它運行沒有標籤的數據?
EM軟聚類在Lingpipe的EM教程,他們說,這是可能的運行沒有監督數據的算法:在lingpipe
有可能通過具有初始分類訓練在一個完全無監督形式的分類隨機分配類別。只有類別的數量必須確定。算法是完全一樣的,收斂後的結果或最大數量的時期是一個分類器。
但是他們的班級TradNaiveBayesClassifier
需要標記和未標記的語料庫運行。我怎樣才能修改它運行沒有標籤的數據?
EM是概率最大似然最優化算法。一般來說,它被應用於無監督算法(用於聚類),如PLSA,高斯混合模型。
我認爲線管文件是說你可以使用所有數據標籤的隨機初始化(每個數據的標籤分佈),然後送入NB計算ELBO(證據下限),然後最大化它以獲得更新參數。
總之,您將需要使用NB寫出M步 - 更新模型參數。