4
通過邏輯迴歸示例工作並在接近statsmodels部分時遇到一些困難。在過去的Python 3和熊貓數據框中,df返回一個迭代器而不是列表。我曾嘗試調整同一與「分對數」卻仍然接受一個ValueErrorPython 3 statsmodels Logit ValueError:進入DLASCL參數編號5時有非法值
import numpy as np
import pandas as pd
import os
import statsmodels.api as sm
import pylab as pl
df = pd.read_csv('admissions.csv')
df.head(n=5)
df.columns = ['admit', 'gre', 'gpa', 'prestige']
dummy_ranks = pd.get_dummies(df['prestige'], prefix='prestige')
cols_to_keep = ['admit', 'gre', 'gpa']
data = df[cols_to_keep].join(dummy_ranks.ix[:, 'prestige_2':])
data['intercept'] = 1.0
train_cols = data.columns[1:]
logit = sm.Logit(data['admit'], data[train_cols])
result = logit.fit()
ValueError異常:在進入DLASCL參數號碼5有一個非法值
你應該給「admissions'csv」的鏈接 – Ranjeet
這種類型的錯誤消息幾乎總是對數據的INF或NaN時調用線性代數函數。如果缺少值,則可以使用熊貓刪除它們或在模型中使用「missing」關鍵字。 – user333700