-1
我發帖要問是否有任何方法,或有關如何處理分類問題中的離散和連續數據的想法。機器學習:如何處理離散和連續的數據在一起
在我的情況,我有一堆獨立的「批」,有離散的數據。這是與過程相關的數據,每個批次都有不同的點。我也有一個數據集,隨着時間的變化,相同的批次。然而,這一次,每批次都有很多時間觀察。該數據集看上去象下面這樣:
Data Set 1
Batch 1 DiscreteInfo(1) DiscreteInfo(2) ....... DiscreteInfo(n)
Batch 2 DiscreteInfo(1) DiscreteInfo(2) ....... DiscreteInfo(n)
Batch 3 DiscreteInfo(1) DiscreteInfo(2) ....... DiscreteInfo(n)
Batch 4 DiscreteInfo(1) DiscreteInfo(2) ....... DiscreteInfo(n)
Data Set 2
Batch 1 t(1) TimeData
Batch 1 t(2) TimeData
Batch 1 t(3) TimeData
Batch 1 t(4) TimeData
.
.
.
.
Batch n (t1) TimeData
Batch n (t2) TimeData
Batch n (t3) TimeData
我試圖分類所有這些數據是否屬於「好」批次,一個「壞」批,或「馬馬虎虎」批。這由一個特定的離散參數決定(未在數據集中使用)。
我對機器學習非常陌生;任何意見或想法將不勝感激。我正在使用matlab分類學習器來嘗試解決這個問題。
數據的結構與我的問題一樣。我無法給出一個示例數據集,因爲我不認爲我可以分享這些信息。基本上,我們有兩個數據表。一個是離散表,其中包含類別值和各種其他離散信息(通常是寫入過程的內容,每批次只有一次)。在另一個數據表中,我們擁有屬於每個批次的所有時變數據(每批大約有1300行信息;這就像在時間t的溫度一樣) – user3479118
如果您認爲溫度數據是幫助分類的重要信息,那麼你必須爲每個批次設計一個新的列,它將成爲所有這1300行信息的派生列,例如均值,方差,偏度,峯度等。現在使用這些變量將數據放在一個表中,現在可以使用任何標準的機器學習算法。希望這有助於 –