2009-10-20 27 views
7

我想製作一個推薦系統,我的意思是一個算法,查看用戶發佈的偏好和/或評論,然後爲它們提供建議,類似於netflix或亞馬遜使用的。我可以在哪裏瞭解推薦系統?

學習如何寫這樣的東西有什麼好的資源?我應該從哪裏開始?

回答

5

查看Netflix Prize及其discussion forum上的維基百科頁面。此外,有些相關的2009 GitHub Contest是許多不同推薦引擎上的完整源代碼的很好的來源。顯然還有Wikipedia page on the topic itself,它有一些體面的鏈接。

如果你開始寫自己的,你會想使用語料庫。我實際上建議使用Netflix Prize's data set。只需將數據集分成兩部分即可。在第一塊上訓練,並在第二塊上評分算法。

附錄:這種事的一個有點相關的和可怕的應用是predicting demographic information:用戶的性別,年齡,家庭收入,智商,性取向等你也許可以做到大部分這些屬性與Netflix的獎數據集具有相當高的準確度。幸運的是everyone in that dataset is just a number

+0

有什麼可怕的呢?營銷人員會根據您的瀏覽器,IP和來自HTTP標頭的其他信息來嘗試預測您的時間。這不是實際的信息,只是「知情的刻板印象」(條件貝葉斯)。 – isomorphismes 2011-03-14 03:39:06

+1

因爲數據被表示爲「匿名」,但實際上不是?如果用戶從未選擇加入他們的共享數據,這一點尤其糟糕。 – 2011-03-14 20:07:17

+0

我可能不完全明白你的意思。你是否說匿名被違反,因爲我可以準確猜出用戶2871875的人口特徵? – isomorphismes 2011-04-15 09:13:43