2012-02-10 38 views
1

假設我們有來自學生班級的10-D數據。該數據包括像名稱等級課程,講課等類的所有學生的小時號參數。現在,我們要分析講課時數分數的影響。 如果我們密切關注我們的參數,名學生的無關與等級,但課程由學生採取「可能」會對等級影響。機器學習問題中參數間的相互影響

因此,可能存在相互依賴的參數,而其他參數可能完全獨立。我的問題是,我們如何確定哪個參數對我們的分類/迴歸問題有影響,哪些參數沒有影響? PS:我並不是在尋找確切的解決方案。如果有人能夠向我展示正確的谷歌搜索方向或關鍵字,那應該就足夠了。 謝謝。

回答

1

這是independent component analysis的問題。 ICA是用於查找數據集的統計獨立組件的一系列方法。這是一個困難的問題,並且存在用於找到好的解決方案的各種各樣的算法。一種流行的算法是FastICA。還有whiteningdecorrelation的相關概念。