與變量Logistic迴歸不改變

各地不斷變量和Logistic迴歸的幾個問題 -與變量Logistic迴歸不改變

可以說我有一個連續變量，但只有1個在整個數據集值。我知道我應該理想地消除這個變量，因爲它沒有預測價值。而不是手動爲每個功能執行此操作，Logistic迴歸會自動使這些變量的係數爲0嗎？
如果使用這樣的變量（即僅具有一個值）的Logistic迴歸與L1正則化，將正則迫使係數爲0？
在類似的路線上，如果我有一個分類變量，我有3個級別 - 第一級跨度表示60％的數據集，第二跨度35％，第三級5％），我分裂它爲訓練和測試，有一個很好的機會，在測試組第三級可能不會結束，帶領我們這樣一個場景，我們有在測試集訓練集一個價值以及其他的變量。我如何處理這種情況？正規化會自動處理這樣的事情嗎？

關於問題3）

如果你想確保兩個訓練和測試集包含樣品從每個分類變量，你可以簡單地將每個分組到測試和訓練集然後再結合這些。

關於問題1）和2）

用於與方差爲零的變量的係數中應該是零，是的。但是，這種係數「自動」將被設置爲零還是被排除在迴歸之外取決於實施。

如果你自己實現迴歸，您可以發佈的代碼，我們可以專門討論。

我建議你找到迴歸的實現版本，並使用玩具的數據進行測試。然後你會得到你的答案，無論係數是否設置爲零（我認爲）。

2016-07-05 13:18:12

回答