2017-03-29 43 views
0

我有一些csv文件以數字形式存在一些數據,例如睡眠時間,工作時間等數據以及二進制數據,例如我是否參加過考試。有了這些數據,我試圖預測我今天看電視的時間有多少。問題在於我不確定哪種WEKA算法或方法可能最好?由於我試圖預測一個數值,並有一些變量是數字和其他二進制....我會很感激任何幫助!Weka練習選擇最佳算法

回答

0

一種選擇是將這個迴歸問題分解成一個分類問題,也就是說你可以以30分鐘的間隔遞增。

需要考慮的另一件事是你在這個迴歸中期望的精度數量,我的意思是說你的分類器能夠區分10分鐘的電視和11分鐘的電視嗎?如果不會,但是再次,這取決於您的應用程序。

另外,您有多少個數據實例?數據集有多種多樣?我建議首先使用簡單的樸素貝葉斯分類器,因爲它不太容易出現過度擬合,比隨機森林(當數據量低時)更容易。