2013-06-25 117 views
0

我對機器學習和聚類的概念相當陌生。我已經安裝了Weka並試圖弄清它是如何工作的。目前,我的訓練數據如下。WEKA - 天氣預報

@relation weather 

@attribute year real 
@attribute temperature real 
@attribute warmer {yes,no} 

@data 

1956 , 68.98585 , yes 
1957 , 67.52131 , yes 
1958 , 65.853386 , no 
1959 , 66.32705 , yes 
1960 , 65.89773 , no 

所以,我試圖建立一個模型,應該預測它是否每年和每年都變得更暖。

如果我必須預測1961年是否變暖或變冷,我是否應該提供如下的測試數據?

@relation天氣

@attribute year real 
@attribute temperature real 

@data 

1961 , 70.98585  

我已刪除的列溫暖,我想通過訓練集我先前提供的預測。我可以使用Weka提供的任何算法(J48,BayesNet等)。有人可以幫助我瞭解如何理解這些概念嗎?

回答

0

您不需要自己製作培訓和測試套件,Weka會爲您做到這一點。即使你這樣做,也不要刪除測試集中預測的值--Weka會確保所有事情都能正確發生,但需要實際值來確定預測是否正確,並告訴你模型的執行情況。

你的問題是一個分類問題,即你想預測標籤「是」或「否」。並非Weka中的所有算法都適用,但不適用的算法會變灰(如果使用GUI)。

在更一般的說明中,您不太可能獲得具有良好結果的數據。這更多的是時間序列預測任務(即給定這些過去的值,它將來會如何發展),Weka並沒有真正提供算法。你可以找到更多關於Wikipedia的信息。

要使用Weka獲得更好的模型,您可以將前一年(或之前的2年)的溫度值添加爲特徵,但最終聽起來像您想要使用某些可以進行時間序列分析和預測的東西。

+0

我有一個巨大的天氣數據集。使用Hadoop,我得到了一個更簡單的數據集,其中包含年份和當年的平均溫度。利用這些數據,現在我必須預測氣候模式,並確定它是逐年變暖還是變冷。我有從1950年到2013年的數據收集,但它只有2列。他們是「年,平均溫度」。我怎樣才能讓機器學習和聚類決定氣候模式? – Ramesh

+1

這聽起來像你想要使用線性迴歸的一系列溫度,看看它是否有一個積極的梯度。 –

+0

再次感謝。我看到線性迴歸可以應用於數值。那麼這是否意味着我應該對平均氣溫應用線性迴歸,並嘗試預測天氣?如何確定預測是否正確?我的意思是,如果標準偏差誤差應該更小? – Ramesh