我的意思是在亞馬遜上的產品建議或在Last.fm上的更具體類似的樂隊推薦。來自客戶購買/聆聽行爲的「類似產品/音樂/ ...」的統計計算是如何工作的?
考慮到您可以儲存您的用戶的完整聆聽/購買行爲(世衛組織聽取了何種方式?),您如何計算哪些頻段與任何給定頻段相似,以及多少?
我在維基百科上發現了一些網站(Association rule learning,Affinity analysis),但我想從程序員的角度獲取一些信息,最好是一些僞代碼或Python代碼。
考慮到我有
dic = {
"Alice" : { "AC/DC" : 2, "The Raconteurs" : 3, "Mogwai" : 1 },
"Bob" : { "The XX" : 4, "Lady Gaga" : 3, "Mogwai" : 1, "The Raconteurs" : 1 }
"Charlie" : { "AC/DC" : 7, "Lady Gaga" : 7 }
}
在數字播放次數,我怎麼會遍歷這個發現帶的相似性?
我不認爲你很清楚你在問什麼:你在問什麼數據結構需要實現購物籃分析? – 2011-02-22 17:49:15
嗯,也許我可以編輯我的問題,使其更清晰。我正在尋找使用的算法。如果它被稱爲購物籃分析,你已經以某種方式幫助了我。我現在在維基百科的Affinity Analysis下找到它。但是,我無法在任何地方找到僞代碼或Python代碼。 – 2011-02-22 17:55:47