各地不斷變量和Logistic迴歸的幾個問題 -與變量Logistic迴歸不改變
可以說我有一個連續變量,但只有1個在整個數據集值。我知道我應該理想地消除這個變量,因爲它沒有預測價值。而不是手動爲每個功能執行此操作,Logistic迴歸會自動使這些變量的係數爲0嗎?
如果使用這樣的變量(即僅具有一個值)的Logistic迴歸與L1正則化,將正則迫使係數爲0?
在類似的路線上,如果我有一個分類變量,我有3個級別 - 第一級跨度表示60%的數據集,第二跨度35%,第三級5%),我分裂它爲訓練和測試,有一個很好的機會,在測試組第三級可能不會結束,帶領我們這樣一個場景,我們有在測試集訓練集一個價值以及其他的變量。我如何處理這種情況?正規化會自動處理這樣的事情嗎?
ND