0

在這裏我是初學者,我想爲我的生活,瞭解了有和我一樣同樣的問題後流動這一個疊層.. Logistic Regression:Unknown label type: 'continuous'Python的ValueError異常:未知的標籤類型:「連續」

這是我下面的機器學習對碼,並且外殼輸出的是給我ValueError異常:未知的標籤類型:「連續」

我想我明白,我「傳遞花車,其預計分類值作爲目標分類vector。如果將它轉換爲int,它將被接受爲輸入(儘管如果這是正確的做法,這是值得懷疑的)。最好通過使用sc來轉換你的訓練分數ikit的labelEncoder函數「

有人可以給我一個關於如何將scikit的labelEncoder函數併入我的代碼的提示嗎?這是否在聲明分類符X & y之前執行?無論我在做什麼,我都在做錯事。謝謝

import numpy as np 
from sklearn import preprocessing, cross_validation, neighbors, utils 
import pandas as pd 

df = pd.read_csv('C:\\Users\\bbartling\\Documents\\Python\\WB    
Data\\WB_RTU6data.csv', index_col='Date', parse_dates=True) 

print(df.head()) 
print(df.tail()) 
print(df.shape) 
print(df.columns) 
print(df.info()) 
print(df.describe()) 


X = np.array(df.drop(['VAV6znt'],1)) 
df.dropna(inplace=True) 

y = np.array(df['VAV6znt']) 


accuracies = [] 

X_train, X_test, y_train, y_test =    
cross_validation.train_test_split(X,y,test_size=0.50) 

clf = neighbors.KNeighborsClassifier(n_neighbors=50) 
clf.fit(X_train, y_train) 
accuracy = clf.score(X_test, y_test) 

print(accuracy) 

enter image description here enter image description here

回答

1

由於您VAV6znt列是浮動的,這意味着你正在試圖估計從數據的數值。這使它成爲一個迴歸問題,並且您正在使用KNeighborsClassifier這是一個分類估算器。

嘗試使用KNeighborsRegressor或任何其他名稱中含有Regressor的估算器。

將它們轉換爲int可以工作,但不會給出好的結果,因爲這意味着您的數據中包含許多類,因爲它們是唯一的整數,這顯然是錯誤的。

+0

感謝您的迴應,你能告訴我我的代碼在哪裏轉換爲整數?我不太明白這一點,我想盡量避免這種情況......我有一種感覺,我所有的工作都將是這種類型的'浮動'型數據..任何幫助都非常感謝,我也試圖找到所有Sci kit學習「Regressor」類型估計器 – HenryHub

+1

@HenryHub你在你的問題中提到「如果你將它轉換爲int,它將被接受爲輸入」。無論如何,你應該首先了解分類和迴歸任務。無論如何,在此頁面上搜索Regressor:http://scikit-learn.org/stable/modules/classes.html#api-reference –

+1

這工作非常好,謝謝你的提示。我不得不在分類和迴歸任務之間做一些研究。 – HenryHub

相關問題