2011-07-30 60 views
2

如何使用樸素貝葉斯算法編寫僞碼來將句子分類爲好或不好?如何在句子上使用樸素貝葉斯

我假設第一步將獲得實驗數據,以便您可以獲得具有良好/不良詞彙的例句,併爲這些句子輸出示例(分類爲好或不好)。但是,我將如何能夠使用這些數據來生成算法本身?

回答

1

我不確定在這種情況下「好」或「壞」是什麼意思,但您可能會發現this research paper on Bayesian spam filtering有用,特別是關於「特定於域的屬性」的部分,它描述瞭如何選擇各種特徵嘗試過濾垃圾郵件。如果通過「好」和「壞」句子,你試圖找到這些句子的各種標準,這篇論文可能是一個很好的領導。如果通過「好」和「壞」句子,你正在尋找關於檢測語法錯誤等的信息,這可能不是一個很好的地方。 :-)