我對機器學習和聚類的概念相當陌生。我已經安裝了Weka並試圖弄清它是如何工作的。目前,我的訓練數據如下。WEKA - 天氣預報
@relation weather
@attribute year real
@attribute temperature real
@attribute warmer {yes,no}
@data
1956 , 68.98585 , yes
1957 , 67.52131 , yes
1958 , 65.853386 , no
1959 , 66.32705 , yes
1960 , 65.89773 , no
所以,我試圖建立一個模型,應該預測它是否每年和每年都變得更暖。
如果我必須預測1961年是否變暖或變冷,我是否應該提供如下的測試數據?
@relation天氣
@attribute year real
@attribute temperature real
@data
1961 , 70.98585
我已刪除的列溫暖,我想通過訓練集我先前提供的預測。我可以使用Weka提供的任何算法(J48,BayesNet等)。有人可以幫助我瞭解如何理解這些概念嗎?
我有一個巨大的天氣數據集。使用Hadoop,我得到了一個更簡單的數據集,其中包含年份和當年的平均溫度。利用這些數據,現在我必須預測氣候模式,並確定它是逐年變暖還是變冷。我有從1950年到2013年的數據收集,但它只有2列。他們是「年,平均溫度」。我怎樣才能讓機器學習和聚類決定氣候模式? – Ramesh
這聽起來像你想要使用線性迴歸的一系列溫度,看看它是否有一個積極的梯度。 –
再次感謝。我看到線性迴歸可以應用於數值。那麼這是否意味着我應該對平均氣溫應用線性迴歸,並嘗試預測天氣?如何確定預測是否正確?我的意思是,如果標準偏差誤差應該更小? – Ramesh