蟒蛇sklearn GradientBoostingClassifier熱啓動錯誤

我使用的模型訓練的一組數據的分類與1000次迭代：蟒蛇sklearn GradientBoostingClassifier熱啓動錯誤

clf = GradientBoostingClassifier(n_estimators=1000, learning_rate=0.05, subsample=0.1, max_depth=3) 
clf.fit(X, y, sample_weight=train_weight)

現在我想增加迭代次數至2000所以我：

clf.set_params(n_estimators=2000, warm_start=True) 
clf.fit(X, y, sample_weight=train_weight)

，但我得到了以下錯誤：

--------------------------------------------------------------------------- 
ValueError        Traceback (most recent call last) 
<ipython-input-13-49cfdfd6c024> in <module>() 

     1 start = time.clock() 
     2 clf.set_params(n_estimators=2000, warm_start=True) 
----> 3 clf.fit(X, y, sample_weight=train_weight) 
     4 ... 

C:\Anaconda3\lib\site-packages\sklearn\ensemble\gradient_boosting.py in fit(self, X, y, sample_weight, monitor) 
    1002          self.estimators_.shape[0])) 
    1003    begin_at_stage = self.estimators_.shape[0] 
-> 1004    y_pred = self._decision_function(X) 
    1005    self._resize_state() 
    1006 

C:\Anaconda3\lib\site-packages\sklearn\ensemble\gradient_boosting.py in _decision_function(self, X) 
    1120   # not doing input validation. 
    1121   score = self._init_decision_function(X) 
-> 1122   predict_stages(self.estimators_, X, self.learning_rate, score) 
    1123   return score 
    1124 

sklearn/ensemble/_gradient_boosting.pyx in sklearn.ensemble._gradient_boosting.predict_stages (sklearn\ensemble\_gradient_boosting.c:2564)() 

ValueError: ndarray is not C-contiguous

什麼我錯在這裏做什麼？

來源

2016-03-02 breezymri

您通常不能修改適合調用之間的sklearn分類器，並期望它能夠正常工作。估計量的數量實際上會影響模型內部對象的大小 - 因此它不僅僅是一些迭代（從編程的角度來看）。

來源

2016-03-02 23:28:17 lejlot

然後參數'warm_start'的用途是什麼？我認爲這就是它的原因。 – breezymri

剛剛看到你的'set_params'調用。如果您獲得更多培訓數據，我認爲目的是更新現有的分類器。 –

是的，warm_start是更多的訓練數據/更新舊的解決方案，但不改變其結構 – lejlot

warm_start正在正確使用。實際上有一個阻止這個工作的錯誤。

在此期間解決方法是將數組複製到C-連續的數組：

X_train = np.copy(X_train, order='C') 
X_test = np.copy(X_test, order='C')

參考：discussion和bug

來源

2016-10-17 05:00:53

在我看來，這個問題是，你沒有將warm_start = True傳遞給構造函數。如果你這樣做：

clf = GradientBoostingClassifier(n_estimators=1000, learning_rate=0.05, subsample=0.1, max_depth=3, warm_start=True)

你就可以使用，以適應更多的估計：

clf.set_params(n_estimators=2000) 
clf.fit(X, y, sample_weight=train_weight)

如果它不工作可能是你應該嘗試更新您的sklearn版本。

來源

2016-10-18 16:07:45

即使在將warm_start = True *傳遞給構造函數時，也存在會導致此錯誤的錯誤*。看到我的答案的鏈接。 –

蟒蛇sklearn GradientBoostingClassifier熱啓動錯誤

回答

相關問題