2012-11-13 70 views
4

我在python中使用樸素貝葉斯分類器進行文本分類。是否有任何平滑方法來避免python NLTK中看不見的單詞的零概率?提前致謝!在Python中平滑NLTK

回答

2

我建議用低(特別是1)頻率替換所有單詞到<unseen>,然後在這個數據中訓練分類器。 對於分類,如果單詞不在訓練數據中,您應該查詢<unseen>的模型。