2013-04-27 90 views
0

基於以下數據,我試圖使用gradeint下降預測什麼 標籤將與新用戶相關聯。注意這些數字僅用於illustravite目的,實際上這些數字對應於單詞。如何預測使用梯度下降

username tags title group 

user1 1  Senior group1 
user2 2  Senior group2 
user3 3,4,5 Junior group2 
user4 2,8 Dev  group1 

因此,如果一個新的用戶說:「USER5」,我知道該用戶的標題和組我可以使用「R」梯度下降來預測什麼標籤,用戶可以要求?

+3

梯度下降是一種數值優化方法。除非您指定要優化的統計模型和損失函數,否則要求「使用梯度下降的預測」沒有意義。例如,檢查R軟件包'glmnet';我認爲它使用梯度下降來適應正則化的線性模型。 – sieste 2013-04-27 11:48:47

回答

4

漸變下降是一種學習迴歸模型(例如)的方法,而不是製作預測的方法。也就是說,給定一組訓練數據,可以使用梯度下降和損失函數來確定迴歸模型的係數。

在你的特定情況下,迴歸模型似乎並不是最合適的。我假設這些標籤的數字是ID,並且沒有數字的實際含義。也就是說,標籤1和2彼此相鄰,而1和3彼此分開的事實並不意味着什麼。相反,我會看看分類模型,如決策樹。如果您剛剛開始機器學習,我建議您看看Weka,它有許多不同的機器學習算法和相對易用的用戶界面。您可以使用它快速探索不同的算法和模型對您的數據執行的操作。