2017-05-01 45 views
0

在我的項目中,我使用GridSearchCVsklearn對模型的指定參數值進行了徹底搜索,以找到最佳可能參數值。我只是在RandomForestClassifier中測試它,並幫助我找到最好的max_depthn_estimators。基於此,我有兩個問題:sklearn中的最大似然估計

  1. GridSearchCV是否使用最大似然估計(MLE)的概念?
  2. 而不是每個模型使用GridSearchCV,有沒有一種技術,我可以用它來選擇我的數據集的最佳模型?我認爲這是根據模型選擇的概念,但我不知道如何通過sklearn使用它。

謝謝

回答

2

不GridSearchCV使用最大似然估計(MLE)的概念引擎蓋下?

MLE是概率推理,從而它可以僅應用於概率模型。 GridSearchCV不是基於MLE的,根據對測試誤差的直接估計進行模型選擇是一個簡單的技巧。因此給定一個特定的模型,它可以指定一個代表它有多好的數字 - 在許多模型中,您可以簡單地選擇數量最多(估計推廣力度最高)。

不是每個模型都使用GridSearchCV,有沒有一種技術可以用來爲我的數據集選擇最佳模型?我認爲這是根據模型選擇的概念,但我不知道如何通過sklearn使用它。

有很多,但sklearn相當多實現只有各種列車測試分離器(簡歷,隨機等);相反,你可能要考慮支持其他庫:

  • 貝葉斯優化
  • 的Parzen樹估計技術

哪些是找好hyperparamters(而非只是檢查已有的更先進的方法那些)。