我想在並行多處理器上使用sklearn.grid_search.GridSearchCV()
。這是我第一次這樣做,但我最初的測試表明它似乎正在工作。scikit學習:一般問題有關的並行計算
我想了解文檔的this部分:
n_jobs
:INT,默認爲1的作業數並行運行。
pre_dispatch
:int或字符串,可選控制平行 執行過程中得到派出的就業人數。減少這個數字可能是有用的,以避免 內存消耗爆炸時,更多的就業機會獲得比派遣CPU可以 過程。該參數可以是:
無,在這種情況下立即創建所有作業併產生 。使用此輕型和快速運行的作業,以避免 延誤,由於作業的int按需產卵,給那些催生了一個字符串就業總數的 確切的數字,給人一種 表達n_jobs的功能,在 '2個* n_jobs'
有人可以打破這種下來嗎?我無法理解n_jobs
和pre_dispatch
之間的差異。如果我設置n_jobs = 5
和pre-dispatch=2
,這是怎麼從剛剛設置n_jobs=2
不同?
小心細化?我不明白當5個進程必須共享2個數據「塊」時會發生什麼? – Fequish
'pre_dispatch'主要控制發送的任務的「批次」數量。 – rightskewed