我目前在數據科學課程中,我的一個項目正在創建一個模型來預測員工流失。statsmodels中的低R2和scikit中的高精度/精度
我有一個模擬數據集,我正在使用,我已經設置了我的X和Y's。
我跑了4個模型。第一個是在statsmodels進行邏輯迴歸。那個輸出是0.142的僞Rsquared,非常低。
但是,我在scikit中學習的接下來的3個模型(邏輯迴歸,k最近鄰居和決策樹)。在這些模型中,我將X和Y分解爲訓練和測試集。對於每個人,我都運行準確度和精確度分數,他們都高於75%。另外,我在每個模型上都進行了交叉驗證評分,每個評分仍高於75%。
我的問題是,我可以在scikit學習模型上獲得高分,並且statsmodel上運行的R2很低?
這種情況會發生嗎?如果是這樣,怎麼解釋?謝謝!
歡迎來到SO。請閱讀這個[how-to-ask](http://stackoverflow.com/help/how-to-ask)來改進您的問題,並提供足夠的具體信息,例如試圖解決問題和錯誤消息的代碼等 – thewaywewere
也許,我誤解了你,但是R2是ERROR的度量,所以,當錯誤率低時,得分相應較高。似乎一切都好了 –
這是非常不清楚的。你正在解決的問題是迴歸還是分類?你說你測量了'R2',那麼它似乎迴歸了。但是你說你計算準確度和精度?準確性和精確度用於分類,而不是迴歸。你可以發佈代碼庫和一些數據。 –