我用電影鏡頭數據文件(ml-100k.zip)u.data不變,所以它有列:userID,MovieID和用戶評級。如果我使用SIMILARITY_LOGLIKELIHOOD(LLR),項目評分真的被忽略了嗎?
我用LLR:
Hadoop的JAR C:\ HDP \象夫,0.9.0.2.1.3.0-1981 \核心\目標\ Mahout的核心 - 0.9.0.2.1.3.0-1981在職.jar org.apache.mahout.cf.taste.hadoop.item.RecommenderJob -s SIMILARITY_LOGLIKELIHOOD --input u.data --output udata_output
當我查看udata_output文件時,我看到推薦的電影ID,然後是推薦分數像:
1226:5.0 和 896:4.798878
個的推薦分數似乎從5.0變化到4.x
然而,當我從u.data文件中刪除用戶評級柱和上述予接收的結果像重新運行在同一命令行:
615:1.0
其中ALL推薦分數爲1.0。
2個問題:
1)如果LLR忽略用戶評級和我改變的是是否提供用戶評價的唯一輸入爲什麼推薦分數變化?
2)總體而言,我試圖確定推薦排名,所以我使用LLR。此外,我應該忽略推薦分數,只關注推薦項目的訂單(例如:第一項排名高於第二項)?
在此先感謝。
再次感謝。另外,我沒有意識到我正在使用較早的Hadoop版本。我會研究你建議的新的。 – RandomTask 2015-02-08 07:17:31
查看Mahout 1.0-SNAPSHOT。它與Hadoop或內存版本相比是一個非常不同的架構。 – pferrel 2015-02-09 15:24:35