1

我的理解是正確的:在下面的代碼中,「greed_search.fit(X,Y)」與嵌套的CV沒有任何關係?這意味着無法在sklearn中使用嵌套CV獲取最佳參數。使用sklearn嵌套交叉驗證獲得最佳參數

# inner cross_validation 
    greed_search = GridSearchCV(estimator=estimator, param_grid=parameters, cv=inner_cv, scoring=optimized_for) 
    greed_search.fit(X, optimization_label) 
    # Nested CV with parameter optimization 
    nested_score = cross_val_score(greed_search, X=X, y=Y, cv=outer_cv) 
+0

什麼是inner_cv?這是一個數字嗎? –

回答

1

你是對的:在代碼中greed_search.fit(X, optimization_label)的是不被嵌套到下一個交叉驗證執行。

要回答你的第二個問題,我問你另一個問題:什麼應該是嵌套到交叉驗證的網格搜索的最佳參數?第一批的?最常見的?

內部網格搜索,在外部交叉驗證的每一步,根據當前步驟的訓練數據選擇最佳參數。因此參數可以在摺疊之間改變。自己做外部交叉驗證可以計算每個步驟的最佳參數,但我不認爲你真的需要它。