2016-04-28 53 views
1

我有一個數據集,其中包含來自客戶的訪問歷史記錄。學習如何預測未來客戶的歷史行爲

它有三列數據集,包括客戶ID,AM/PM(AM或PM訪問)和Weekday/Weekend(工作日或週末訪問)。

我想從這個數據集中學習,並選擇在指定輸入(如AM/Weekday)中訪問次數最多的前50位客戶。現在,我使用一類SVM(我只有積極(訪問)數據)爲每個客戶創建模型。由於一類SVM只有二進制輸出,因此我只能告訴某個客戶將訪問或不輸入指定的輸入,而不是選擇前50名客戶。

我想知道是否有一個算法,可以從一個積極的唯一數據集中學習,並給出得分或概率,如輸出?

+1

這是一個足以Data Science Stack Exchange(http://datascience.stackexchange.com/)的問題。你可能會在那裏得到更多的專業意見你也可以看看這個:https://pkghosh.wordpress.com/2015/07/06/customer-conversion-prediction-with-markov-chain-classifier/ – armatita

回答

0

這是機器學習中的一個子類別問題。您可以從這份調查中學到很多東西:「一級分類: 技術的研究和回顧分類法」(http://arxiv.org/pdf/1312.0049.pdf)。希望能幫助到你。