我有一組的N個數據點X = {X 1 ,...,X Ñ}和一組N個目標值/類ÿ = {y ,...,y n}。考慮到「窗口」(缺少更好的術語)的數據點(例如,數據點),構建給定的特徵向量。我可能要堆疊 「的最後4個數據點」,即,x I-4,X I-3,X I-2,X I-1用於Y 我的預測。scikit學習定製變壓器/管道,改變X和Y
顯然,對於窗口大小爲4的這樣的特徵向量不能爲前三個目標值構建,我想簡單地刪除它們。同樣對於最後的數據點x n。
這不會是一個問題,除非我想這是作爲sklearn管道的一部分發生的。到目前爲止,我已經成功地爲其他任務編寫了一些自定義變換器,但那些不能(據我所知)更改Y矩陣。
有沒有辦法做到這一點,我不知道或者我堅持做這個作爲管道外的預處理? (這意味着,我將無法使用GridsearchCV來查找最佳窗口大小和移位。)
我試過尋找這個,但是我想出的所有是this question,它處理從X矩陣。在那裏接受的答案讓我想到,我想要做的並不是scikit-learn支持的,但我想確保。
看到示例庫是的,這就是我的意思。我不能將我的管道轉儲到一個GridSearchCV中,我發現這是執行CV最方便的方法。我相當肯定我可以讓它手動工作。謝謝 –