2013-04-28 50 views
0

我可以使用聚類(例如使用k-means)在Weka中進行預測嗎?在Weka中使用聚類預測

我有一些基於總統選舉研究的數據。我有調查問卷(數字屬性)的答案,並且我有一個屬性是問題的答案您要投票誰?(1,2或3)

我使用Weka中的一些分類器(例如Bayes)進行預測。我的結果是基於這個答案(投票意向),我有大約60%的回憶(正確預測的比率)。

我知道集羣是一個不同的東西,但我可以使用集羣來做出預測嗎?我已經試過了,但我已經意識到聚類總是選擇自己的質心,並且它不使用我的投票意圖問題。

回答

3

Explain results of K-means

必須是你的同事。他似乎使用相同的數據集,如果我們都可以查看數據,這將會很有幫助。

通常,聚類不是分類或預測。

但是,您可以嘗試使用從羣集獲得的信息來改善您的分類。兩個這樣的技術:

  • 替代你的數據集與聚類中心,並以此爲分類
  • 火車上的每個單獨的分類(至少如果你的集羣是相當純WRT的類標籤。!)集羣,並建立一個集合(特別是,如果你的集羣是不均勻的)

但我相信你對分類或聚類的理解還不夠遠,無法嘗試這些。你需要仔細處理它們,並且很好地瞭解你的數據。

+0

是的,我的理解還不是很好。可以使用Weka做些簡單的事情嗎?有什麼教程可以做我想做的事嗎? – Dchris 2013-04-29 09:18:42

+0

那麼,有Weka書...這是一本非常好的書,使用它! – 2013-04-29 20:10:20

+0

是這本書嗎? http://www.cs.waikato.ac.nz/ml/weka/book.html – Dchris 2013-04-29 21:42:46

0

是的。您可以使用Weka界面通過羣集進行預測。首先,使用預處理選項卡上傳您的培訓數據。然後,轉到分類標籤,下分類,單擊選擇,選擇ClassificationViaClustering。 weka使用的默認聚類算法是SimpleKMean,但您可以通過點擊選項字符串(即選擇按鈕旁邊的文本)來更改,weka將顯示一個消息框,單擊選擇並選擇一組聚類算法將被列出以供選擇(例如EM)。之後,您可以使用weka進行分類時,按照正常方式點擊設置,進行交叉驗證或上傳測試數據。

希望這會幫助任何人有同樣的問題!