0
我正在觀看這個着名的Intro to Stat Learning課程中的video關於在特徵選擇中進行交叉驗證的內容。交叉驗證是特徵分類中的選擇
教授們說,在進行任何模型擬合和特徵選擇之前,我們應該形成褶皺。他們還表示,在每一次拆分中,我們最終都會得到一組不同的「最佳預測指標」。我的問題是,如果是這種情況,我們如何確定未來使用的總體最佳預測指標。換句話說,如果我有一組新的數據,我怎麼知道我應該使用哪些預測指標?
我正在觀看這個着名的Intro to Stat Learning課程中的video關於在特徵選擇中進行交叉驗證的內容。交叉驗證是特徵分類中的選擇
教授們說,在進行任何模型擬合和特徵選擇之前,我們應該形成褶皺。他們還表示,在每一次拆分中,我們最終都會得到一組不同的「最佳預測指標」。我的問題是,如果是這種情況,我們如何確定未來使用的總體最佳預測指標。換句話說,如果我有一組新的數據,我怎麼知道我應該使用哪些預測指標?
初學者的好問題。 您的問題的答案是使用同一組功能以供將來使用。是的,選擇的功能可能隨時間而改變。但通常情況下會隨着之前選擇的功能而變化。 但重要的是,用於特徵選擇的初始數據應該足夠好,並具有足夠數量的樣本,以便它能夠反映出幾乎所有的問題。如果是這種情況,通常所選的功能對新測試數據的改變也不會太大。
歡迎來到SO!這個問題不是關於編程,所以不適合這個網站。你最好在[交叉驗證](http://stats.stackexchange.com) – Tchotchke