使用sklearn嵌套交叉驗證獲得最佳參數

我的理解是正確的：在下面的代碼中，「greed_search.fit（X，Y）」與嵌套的CV沒有任何關係？這意味着無法在sklearn中使用嵌套CV獲取最佳參數。使用sklearn嵌套交叉驗證獲得最佳參數

# inner cross_validation 
    greed_search = GridSearchCV(estimator=estimator, param_grid=parameters, cv=inner_cv, scoring=optimized_for) 
    greed_search.fit(X, optimization_label) 
    # Nested CV with parameter optimization 
    nested_score = cross_val_score(greed_search, X=X, y=Y, cv=outer_cv)

來源

2017-08-25 E.Asgari

什麼是inner_cv？這是一個數字嗎？ –

你是對的：在代碼中greed_search.fit(X, optimization_label)的是不被嵌套到下一個交叉驗證執行。

要回答你的第二個問題，我問你另一個問題：什麼應該是嵌套到交叉驗證的網格搜索的最佳參數？第一批的？最常見的？

內部網格搜索，在外部交叉驗證的每一步，根據當前步驟的訓練數據選擇最佳參數。因此參數可以在摺疊之間改變。自己做外部交叉驗證可以計算每個步驟的最佳參數，但我不認爲你真的需要它。

來源

2017-08-25 16:07:55

使用sklearn嵌套交叉驗證獲得最佳參數

回答

相關問題