我想知道我怎麼能聲稱我正確地捕捉到我的數據中的「噪音」?具體來說,以主成分分析爲例,我們知道在PCA中,經過SVD後,我們可以將小奇異值清零,並使用低秩近似來重構原始矩陣。如何驗證什麼是噪音什麼是真實數據?
那麼我可以聲稱什麼被忽略的確是數據中的噪音? 有沒有評估指標呢?
唯一的方法我能想出是簡單地從重建的數據減去原始數據。
然後,嘗試在它上面擬合高斯,看看健身是否好。
是像DSP那樣的傳統方法?
順便說一句,我認爲在典型的機器學習任務,測量將是跟進分類性能,但因爲我在做純粹的生成模型,沒有任何附加的標籤。
感謝您的回答,但我的問題是真的只關係到你的最後一段,我想「抓住」噪聲。 我認爲很難像Ben說的那樣定義。 – Jing 2013-03-16 12:51:08