2017-06-21 81 views
0

我正在學習如何使用scikit-learn開發反向傳播神經網絡。我仍然對如何在我的神經網絡中實現k-fold交叉驗證感到困惑。我希望你們能幫助我。我的代碼如下:在MLPClassification中實現K-fold交叉驗證Python

import numpy as np 
from sklearn.model_selection import KFold 
from sklearn.neural_network import MLPClassifier 

f = open("seeds_dataset.txt") 
data = np.loadtxt(f) 

X=data[:,0:] 
y=data[:,-1] 
kf = KFold(n_splits=10) 
X_train, X_test, y_train, y_test = X[train], X[test], y[train], y[test] 
clf = MLPClassifier(solver='lbfgs', alpha=1e-5, hidden_layer_sizes=(5, 2), random_state=1) 
clf.fit(X, y) 
MLPClassifier(activation='relu', alpha=1e-05, batch_size='auto', 
     beta_1=0.9, beta_2=0.999, early_stopping=False, 
     epsilon=1e-08, hidden_layer_sizes=(5, 2), learning_rate='constant', 
     learning_rate_init=0.001, max_iter=200, momentum=0.9, 
     nesterovs_momentum=True, power_t=0.5, random_state=1, shuffle=True, 
     solver='lbfgs', tol=0.0001, validation_fraction=0.1, verbose=False, 
     warm_start=False) 
+1

我認爲你的意圖是你想做kfold分裂和得分。你可以使用['cross_val_score'](http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_val_score.html)。它會爲你做Kfold,同時也會生成分數列表。 –

回答

3

不要將您的數據拆分爲火車和測試。這由KFold交叉驗證自動處理。

from sklearn.model_selection import KFold 
kf = KFold(n_splits=10) 
clf = MLPClassifier(solver='lbfgs', alpha=1e-5, hidden_layer_sizes=(5, 2), random_state=1) 

for train_indices, test_indices in kf.split(X): 
    clf.fit(X[train_indices], y[train_indices]) 
    print(clf.score(X[test_indices], y[test_indices])) 

KFold驗證將您的數據集劃分爲n個相等的公平部分。然後將每個部分分成測試和訓練。有了它,您可以對模型的準確性進行相當準確的度量,因爲它在相當分散的數據的小部分上進行了測試。

+0

我的預測準確性是0%我不知道我做錯了什麼 –

+0

@Trung隨着代碼?不,我以前用這個效果很好。您的數據可能存在問題。檢查以確保'X'和'y'具有相同的長度,並且'X [i]'中的每個值都對應於'y [i]'。把打印語句檢查。 –

+0

你也可以嘗試'clf = MLPClassifier(solver ='lbfgs',alpha = 1e-5,hidden_​​layer_sizes =(5,2),random_state = 1,verbose = True)'並且在訓練期間看它打印什麼。 –