我已經能夠使用result = logit.fit()
做模型預測。python的statsmodel包中的測試和驗證
現在進行測試和驗證設置我們只需要做result.predict(test_df[features])
和result.predict(vald_df[features])
?這就是全部?或者我錯過了一些步驟?當我嘗試部署該模型進行日常預測時,情況會有什麼不同?
我是statmodel的新手,事實上從今天開始,種類不足。我查了幾個博客,信息不相關,所以只是想確定一下。
另外,有沒有一種方法可以直接從statsmodel中提取'Area under ROC'
而不是編碼我們的方式?
對於預測就是這樣。一旦你從一個擬合模型得到了結果實例,你可以在新數據上調用'predict'。新數據需要與原始數據的結構相匹配。如果您使用公式,那麼數據將按照與訓練數據相同的方式進行轉換。如果您直接將設計矩陣作爲DataFrame或numpy數組提供,則用於預測的數據需要與此相匹配,例如,你需要明確包含常量,它不會自動添加。 – user333700