2016-05-24 212 views
-1

我想使用機器學習模型來預測給定日期的註冊數量。我有一套訓練集,其中包含日期,註冊數量和其他一些可用於訓練此分類器的變量/特徵。此外,每30天可見this trend使用機器學習預測數據

最後,我想這樣的事情(使用Python):

exampledata = [({'date':'01-01-2016','day': 'friday', 'holiday': True, 'etc': 0.3}, 20), ({'date':'02-01-2016','day': 'saturday', 'holiday': False, 'etc': 0.3}, 25),({'date':'03-01-2016','day': 'sunday', 'holiday': False, 'etc': 0.4}, 40)] 
classifier.train(exampledata) 
classifier.predict("04-01-2016") 
>>> 30 

我發現Scikit的支持向量分類方法,但我不知道如何適合我的數據

我該如何開始?如果需要更多信息,請告訴我。

+3

我會推薦學習機器學習課程。 – tenwest

回答

1

這可能不是一個令人滿意的答案... 您首先必須選擇一組要用於分類器訓練的屬性。然後你將不得不選擇一個分類器模型來學習。你最終必須爲它提供一套訓練集,一套測試集和一套驗證集,它們都是原始集合的子集。許多技術允許選擇模型及其參數,以便在預測已經學習並測試了所有模型的情況下給出最佳(或最差)的結果。

我的建議是使用scikit-learn(http://scikit-learn.org/stable/)並花費時間訪問它的教程:http://scikit-learn.org/stable/tutorial/。你會發現有很多有用的信息可以幫助你。在學習預測模型時,如何給出培訓項目及其預期結果。