2016-02-20 25 views
1

Logistic迴歸模型使用statesmodels:Statsmodels:書寫式的短方式

log_reg = st.logit(formula = 'label ~ pregnant + glucose + bp + insulin + bmi + pedigree + age', data=pima).fit() 

是存在寫入式(懷孕+葡萄糖+ BP +胰島素+ BMI +譜系+年齡)的第二部分中的任何短方法?這裏所有的列都必須明確提及。如果列數超過100列,則編寫起來會很困難,而且這個陳述也會很長。

回答

0

公式沒有特定的快捷鍵。

您可以使用python字符串操作來構建公式,例如,基於熊貓數據框的列名。

或者你直接使用數組或數據框。但即使如此,如果您想要人類可讀的輸出,例如summary(),您仍然需要一個名稱列表。如果你只需要預測,那麼沒有變量名的數組是有用的。

+0

感謝您的意見。使用Pandas dataframe列名找到一種方法: – BhushanD

+1

'str1 = pima.columns [-1] +「〜」+「+」.join(list(pima.columns [1:len(pima.columns)-1])' 'log_reg = st.logit(公式= str1,data = pima).fit()' – BhushanD