0
想象一下,您是圖書管理員,並且您 已將一堆文本文件(約100) 與一般歧義關鍵字歸類在一起。將文本文件拆分爲兩組 - 無監督學習
每個文本文件實際上是keyword_meaning1 的主題或keyword_meaning2的主題。
您將使用哪種無監督學習方法, 將文本文件分成兩組?
根據多個文本文件可以實現正確分類 的精度(百分比)是多少?
或者可以以某種方式顯示在一個組中,有 需要圖書管理員檢查某些文件,因爲 他們可能會被錯誤地分類?
是不是貝葉斯方法監督?在訓練階段?或者這是一些修改? – xralf
是的,它有監督。我從問題陳述中注意到你有類標籤可用,所以樸素貝葉斯似乎是最直接的方法。 – JooMing
感謝carrot2。 – xralf