我使用XGBoost cv來查找我的模型的最佳回合數。我將不勝感激,如果有人可以證實(或否定),兩輪的最佳數量是:XGBoost CV和最佳迭代
estop = 40
res = xgb.cv(params, dvisibletrain, num_boost_round=1000000000, nfold=5, early_stopping_rounds=estop, seed=SEED, stratified=True)
best_nrounds = res.shape[0] - estop
best_nrounds = int(best_nrounds/0.8)
即:完成了兩輪的總數量是res.shape [0],所以得到最優回合數,我們減去早期回合數。
然後,我們根據用於驗證的分數放大輪次數。 這是正確的嗎?
感謝您的答案有最好的迭代次數,並根據您的解決方案是不是意味着我們使用CV調整PARAMS並獲得最佳增強迭代和計算最佳迭代我們的訓練數據符合cv的摺疊和迭代?然後我們直接在整列火車上訓練模型,並計算出輪數? – LancelotHolmes
我相信best_nrounds = res.shape [0]。 n_fold和estop如何影響最佳迭代次數?我相信res只會報告低於最佳迭代點的值。 – notilas