2012-05-19 163 views
0

我不知道我該如何處理這個問題:機器學習:我應該選擇分類還是推薦?

我有一個數據集。用戶可能是也可能不是資助計劃的一部分。 我想使用機器學習來推斷不屬於該方案一部分的用戶容易受到某些情況的影響,例如1,2,3和4.方案中的人對1,2和4敏感。因此可以推斷,如果你是方案的一部分,你將不會受到條件3的影響。

我有第二個相關的問題也是如此。在資助計劃內,用戶可以有兩個計劃(花費不同的金額)。我想看看那些便宜的計劃是否比那些更昂貴的計劃更容易受到更多的條件影響。

任何人都可以幫助我,這是一個建議或分類問題,我應該看什麼特定的算法?

謝謝。

回答

1

都沒有。這是一個統計問題。你的數據集是完整的,你沒有提到任何需要預測未來科目或計劃的屬性,所以訓練分類器或推薦人似乎不符合它的通常目標。

您可以使用某人的條件作爲特徵及其方案統計作爲目標,使用SVM對其進行分類,然後使用分類性能/準確性作爲類別可分性的度量​​。你也可以考慮聚類。然而,t檢驗會做同樣的事情,並且是一個更爲接受的工具來證明這樣的主張的有效性。

0

看起來你正在試圖建立一個系統,將用戶分類爲資助或不資助,如果沒有資助,爲什麼他們沒有資助。

如果是這種情況,您需要的是可解釋的機器學習分類器,即分類器做出某個決定的原因可以傳達給用戶。您可能想要查看決策樹和(較小程度上)RandomForest和Gradient Boosted Trees。