2016-11-11 37 views
0

我想解析此文件http://www4.stat.ncsu.edu/~boos/var.select/diabetes.rwrite1.txt運行多特徵迴歸,但我得到一個「ValueError:發現數組與昏暗3.估計預計< = 2.「 。順便說一句,輸入必須是浮點數嗎?Sklearn迴歸輸入「發現數組與昏暗3.估計器預計<= 2」

database = open(r'diabetes.rwrite1.txt','r').readlines()[1:] 
lstx = [] 
lsty = [] 
for line in database: 
    splitted = line.split() 
    lstx.append(splitted[0:9]) 
    lsty.append(float(splitted[10])) 


x_ = np.array(lstx)[:, np.newaxis, 1:9] 
x = x_.astype(float) 
y = np.array(lsty) 
lr = LinearRegression() 
lr.fit(x, y) 
+0

打印出x和y的形狀,並與scikit-learn有關的規則進行比較。 (如果需要並且可能的話,非浮游物將被浮動)。我也推薦使用numpy或pandas來完成read-csv部分。 – sascha

回答

0

如果要預測連續變量,則使用LinearRegression。如果你想預測類別,那麼你需要使用分類器,如LogisticRegression或RandomForestClassifier。

在sklearn這些名稱中幾乎總是有「分類器」。

相關問題