我試圖對與Netflix
類似的收視率數據集實現此功能,並且我已經將它用於「工作」;在每次迭代/添加更多功能後,訓練錯誤會趨向0
。如何確定Simon Funk的增量SVD方法的測試錯誤
如何確定這將如何預測測試數據集(具有少量未用於訓練的評分的用戶)? Funk掩飾了這部分內容,這讓我很困惑。
我開始用以下矩陣:
- 用戶功能列表(用戶X NUM_FEATURES)
- 影功能列表(電影X NUM_FEATURES)
- 評分矩陣(影X用戶)
我唯一的方法來更新前兩個矩陣是通過在算法中迭代更新它們的迭代。我不認爲我可以訓練這些矩陣,然後引入一個全新的用戶,並估計他的特徵矩陣是什麼樣的。
我現在試過的是從Rating Matrix
中移除20%的評分,將它們移動到測試矩陣中,並用0填充所有空單元格(在成本函數中忽略)。它不工作。