0

我有一個大的樣本數據集如下: enter image description here如何預測機器學習基於計算的數據?

價格取決於從Val_1到Val_14(總150個功能)的值。我想將此表用作機器學習的學習數據集。 現在我真正想要實施的是基於這些樣本數據來預測價格。可以更改這些值,並且預測價格應該根據這些計算而變化。

我沒有計算價格的具體計算公式,所以我想將這些數據集用作機器學習中數據分類器的學習數據。

我已經嘗試過基於Deeplearning使用Theano與Python的各種算法,但到目前爲止,我只能成功預測具有預定義輸出類的輸出。有沒有使用機器學習算法來預測這些計算的方法?

+1

你想要的是迴歸,而不是分類。 –

+0

我正在使用線性迴歸,但結果不可接受。 – sk3145

回答

0

我不確定深度學習是否是這種情況下的最佳方法 - 您的功能集合非常有限,並且可以預測單個值。我有一種感覺,即使是簡單的迴歸也會給你可接受的價值。

我的建議是,你試着玩H2O提供的不同型號。除了內置許多模型類型之外,它還會繪製各種指標以幫助您選擇最適合您的案例。根據我的經驗,幾乎總是GBM能夠提供最佳結果。

當你找到你要找的東西時,你可以導出模型並直接在java中使用它。或者,大多數模型類型在Python的sklearn中具有相同的功能。

+0

謝謝你的建議。 我一定會考慮一下。 我也編輯了我的原始問題。總共有150個功能可以計算價格。 – sk3145