2014-03-03 35 views
1

有沒有一種方法來估計擬合模型的剩餘時間?例如scikit-learn合適的剩餘時間

model = sk.ensemble.RandomForestRegressor(n_estimators=10) 
model.fit(x, y) 

我有一個非常大的數據集(百萬行),這將需要一些時間,所以我想知道估計時間,所以我可以做其他的thigngs並取回當過程結束。

像隨機森林估計剩餘時間的合奏應該[合理]容易。

回答

6

嘗試verbose選項。您可以從0(無輸出),1(更新每個作業)和2(更新每棵樹)

model = RandomForestRegressor(n_estimators=100, verbose=2, n_jobs=2).fit(X_train, y_train) 
+0

謝謝!這幾乎就是我正在尋找的東西!太糟糕了,僅在每項工作完成後纔會打印時間估計。在每棵樹建成之後有沒有辦法打印估計值? – mikkom

+0

據我所知,我不認爲它可以給你時間估計,因爲每個人的機器都有不同的速度。但是,如果您知道創建一棵樹需要多長時間,那麼您可以很好地估計創建所有樹木的時間。您可以直接在他們的郵件列表中詢問,或者在他們的GitHub頁面https://github.com/scikit-learn/scikit-learn中提出一個新功能。 – ysakamoto

+0

謝謝,我想我會那樣做的。我自己爲Weka創建了類似的時間估算(計算平均樹創建時間並將其投影到未創建的樹上),並且多線程庫已經在最後打印時間估計,這應該非常容易。 – mikkom