2016-10-04 22 views
4

通過邏輯迴歸示例工作並在接近statsmodels部分時遇到一些困難。在過去的Python 3和熊貓數據框中,df返回一個迭代器而不是列表。我曾嘗試調整同一與「分對數」卻仍然接受一個ValueErrorPython 3 statsmodels Logit ValueError:進入DLASCL參數編號5時有非法值

import numpy as np 
import pandas as pd 
import os 
import statsmodels.api as sm 
import pylab as pl 

df = pd.read_csv('admissions.csv') 
df.head(n=5) 

df.columns = ['admit', 'gre', 'gpa', 'prestige'] 
dummy_ranks = pd.get_dummies(df['prestige'], prefix='prestige') 
cols_to_keep = ['admit', 'gre', 'gpa'] 
data = df[cols_to_keep].join(dummy_ranks.ix[:, 'prestige_2':]) 
data['intercept'] = 1.0 
train_cols = data.columns[1:] 


logit = sm.Logit(data['admit'], data[train_cols]) 

result = logit.fit() 

ValueError異常:在進入DLASCL參數號碼5有一個非法值

+0

你應該給「admissions'csv」的鏈接 – Ranjeet

+0

這種類型的錯誤消息幾乎總是對數據的INF或NaN時調用線性代數函數。如果缺少值,則可以使用熊貓刪除它們或在模型中使用「missing」關鍵字。 – user333700

回答

相關問題