2017-02-21 156 views

回答

1

在您的數據矩陣中,缺失的值可以是0,但不是爲一個非常稀疏的矩陣存儲一堆零,而是通常會存儲一個COO矩陣,其中每行都以CSR格式存儲。

如果您正在使用NMF的建議,那麼你就可以通過查找W和H,使得W.H約等於X與所有三個矩陣都是非負的條件因子分解數據矩陣X。當你重建這個矩陣X時,一些缺失值(你將存儲零點的地方)可能變成非零值,有些可能保持爲零。此時,在重構的矩陣中,這些值就是您的預測值。

因此,要回答你的問題,是他們的0或丟失數據的NMF模型?一旦適合的NMF模型將包含您的預測值,所以我將它們計爲零。這是一種預測數據中缺失值的方法。

+0

「算作零」 - 你是什麼意思?我認爲@cech詢問是否在損失函數中考慮了稀疏矩陣暗示的零條目(是試圖重建0條目的$ WH $產品),還是損失函數忽略隱含的用於推斷的零條目(即用戶A沒有對產品B進行評分,如果他這麼做,他會評價什麼......不是用戶A對產品B評價爲0) – Robert