我想知道我們是否可以在sklearn.pipeline
中設置「可選」步驟。例如,對於分類問題,我可能希望在沒有PCA
轉換的情況下嘗試帶有AND的ExtraTreesClassifier
。實際上,它可能是一個具有額外參數的管道,用於指定PCA
步驟的切換,以便我可以通過GridSearch
等對其進行優化。我在sklearn源代碼中看不到這樣的實現,但是是否有任何工作 - 周圍?是否可以在sklearn管道中切換某個步驟?
此外,由於管線中的隨後的步驟的可能的參數值可能取決於參數在先前的步驟中(例如,ExtraTreesClassifier.max_features
有效值取決於PCA.n_components
),是有可能在sklearn.pipeline
指定這樣的一個條件的依賴性和sklearn.grid_search
?
謝謝!
作爲請注意,「ExtraTreesClassifier.max_features」可以是0.0到1.0之間的浮點值,而不是整數值。這在實際功能數量變化時很有用,就像你的情況一樣。 –
謝謝你們兩位有見識的答案。我認爲他們正是我所期待的。 – dolaameng