0

各地不斷變量和Logistic迴歸的幾個問題 -與變量Logistic迴歸不改變

  1. 可以說我有一個連續變量,但只有1個在整個數據集值。我知道我應該理想地消除這個變量,因爲它沒有預測價值。而不是手動爲每個功能執行此操作,Logistic迴歸會自動使這些變量的係數爲0嗎?

  2. 如果使用這樣的變量(即僅具有一個值)的Logistic迴歸與L1正則化,將正則迫使係數爲0?

  3. 在類似的路線上,如果我有一個分類變量,我有3個級別 - 第一級跨度表示60%的數據集,第二跨度35%,第三級5%),我分裂它爲訓練和測試,有一個很好的機會,在測試組第三級可能不會結束,帶領我們這樣一個場景,我們有在測試集訓練集一個價值以及其他的變量。我如何處理這種情況?正規化會自動處理這樣的事情嗎?

ND

回答

0

關於問題3)

如果你想確保兩個訓練和測試集包含樣品從每個分類變量,你可以簡單地將每個分組到測試和訓練集然後再結合這些。

關於問題1)和2)

用於與方差爲零的變量的係數中應該是零,是的。但是,這種係數「自動」將被設置爲零還是被排除在迴歸之外取決於實施。

如果你自己實現迴歸,您可以發佈的代碼,我們可以專門討論。

我建議你找到迴歸的實現版本,並使用玩具的數據進行測試。然後你會得到你的答案,無論係數是否設置爲零(我認爲)。