cross-validation

    1熱度

    1回答

    我是python的新手,並且遇到目標記錄時通過交叉驗證計算RMSE的困難。 我在下面的方式定義RMSE功能(當不記錄目標): def rmse_cv(model): rmse= np.sqrt(-cross_val_score(model, X_train_s, Y_train, scoring="neg_mean_squared_error", cv = 5)) return(rmse)

    0熱度

    1回答

    我正在使用SciKit-Learn 0.18.1和Python 2.7進行一些基本的機器學習。我試圖通過交叉驗證來評估我的模型有多好。當我這樣做: from sklearn.cross_validation import cross_val_score, KFold cv = KFold(n=5, random_state = 100) clf = RandomForestRegresso

    0熱度

    1回答

    我在R中學習plsr,遇到了幾個不同的例子,這些例子讓我感到困惑。我看到了以下兩種方法擬合和找到最佳組件的兩種方法。我只想知道哪一種是正確的方式,並且首選? 1)假設我們有一個稱爲數據的數據幀,它被分成列車數據data.train和測試數據data.test。然後PLSR安裝爲 plsr.fit = plsr(formula, data = data.train, validation = "CV

    1熱度

    1回答

    我試圖使用StratifiedKFold創建列車/測試/ val拆分,以用於非sklearn機器學習工作流程。所以,DataFrame需要拆分,然後保持這種狀態。 我試圖做類似下面,使用.values因爲我路過熊貓DataFrames: skf = StratifiedKFold(n_splits=3, shuffle=False) skf.get_n_splits(X, y) for tr

    0熱度

    1回答

    我通常K-折交叉驗證的實施是很像: K = 10; CrossValIndices = crossvalind('Kfold', size(B,2), K); for i = 1: K display(['Cross validation, folds ' num2str(i)]) IndicesI = CrossValIndices==i; TempInd =

    0熱度

    1回答

    我有一個數據集,一個類有45個觀察值,另一個類有55個觀察值。此外,我使用4個不同的功能,這些功能以前是通過使用功能選擇過濾器選擇的,雖然此過程的結果有點奇怪。 %到85%),因爲我在Matlab上使用classificationLearner。這將確保沒有過度配合?或者仍然有機會呢?我如何確保沒有過度配合?

    1熱度

    1回答

    我使用的是sklearn.model_selection.GridSearchCV和sklearn.model_selection.cross_val_score,同時這樣做時我遇到了意想不到的結果。 在我的例子中,我使用下面的進口: from sklearn.datasets import make_classification from sklearn.pipeline import Pip

    0熱度

    1回答

    我想爲我想,以適應泊松模型的數據集做交叉驗證。然而,我注意到,當我使用lambda = 0時,我得到的功能cv.glm和cv.glmnet的輸出非常不同。下面是我的基本泊松模型代碼(第一部分是數據集的設置): game_soon <- function(game_type, hour){ ret_vec <- c() len_game_type <- length(game_t

    1熱度

    1回答

    我已經開始工作的一個項目,其中我需要檢測訓練的參數對於給定的scikit學習估計,如果可能的話,找個分類變量(和連續那些合理的時間間隔)的允許值。 我可以使用estimator.get_params()來獲取帶參數的字典,然後使用estimator.set_params(**{'var1':val1, 'var2':val2})來設置值,依此類推。 例如,對於KNN分類器,我們有以下的參數字典:

    5熱度

    1回答

    最近,我正在做多個實驗來比較Python XgBoost和LightGBM。看起來這個LightGBM是一種新的算法,人們說它在速度和準確性方面比XGBoost更好。 這是LightGBM GitHub。 這是LightGBM python API documents,在這裏你會發現你可以調用的python函數。它可以直接從LightGBM模型調用,也可以通過LightGBM scikit-lea