r-caret

    3熱度

    1回答

    從文檔: 對於自舉樣本,使用簡單隨機採樣。 對於其他數據拆分,當y是試圖平衡拆分中的類分佈的因素時,隨機抽樣在y 的級別內完成。 對於數字y,根據百分位 將樣本分成組,並在這些子組內對樣本進行抽樣。 對於createDataPartition,通過組 參數設置百分位數。 我不明白爲什麼需要這個「平衡」的東西。我想我表面上理解它,但是任何額外的見解都會非常有幫助。

    0熱度

    1回答

    以下是一個可重複的例子,什麼基本上我試圖做的,正在創作5點估算的數據集然後應用SVM使用中插入符號火車功能各估算數據集,然後合奏使用caretEnsemble產生訓練模型。最後,我使用整體模型預測每個測試集。 不過,我得到這個錯誤 Error in check_bestpreds_obs(modelLibrary) : Observed values for each component mode

    1熱度

    1回答

    正從glmnet我的預測後,我試圖用「預測」功能,在「ROCR」軟件包,以獲取TPR無效,FPR等,但得到這個錯誤: pred <- prediction(pred_glmnet_s5_3class, y) Error in prediction(pred_glmnet_s5_3class, y) : Format of predictions is invalid. 我輸出glmnet預

    0熱度

    1回答

    我在進行交叉驗證,其中來自同一組的樣本不能在列車和測試中進行。 Python具有Sklearn函數GroupKFold。 R或脫字符有類似嗎?

    0熱度

    1回答

    我正在構建兩個不同的分類器來預測二進制輸出。然後我想通過使用ROC曲線和它下面的面積(AUC)比較兩個模型的結果。 我將數據集分爲訓練集和測試集。在訓練集上,我執行一種交叉驗證的形式。從交叉驗證的保留樣本中,我可以爲每個模型建立ROC曲線。然後,我使用測試集上的模型並構建另一組ROC曲線。 結果是矛盾的,這使我感到困惑。我不確定哪個結果是正確的,或者我是否做了完全錯誤的事情。示例ROC曲線顯示RF

    2熱度

    1回答

    我有以下data.table,其中每個唯一的x值與唯一的y值相關聯。於是我強迫一個x價值NA第k近鄰鍛鍊的目的: dt <- data.table(x = rep(c(1:4), 3), y = rep(c("Brandon", "Erica", "Karyna", "Alex"), 3)) dt[3, 1] <- NA print(dt) # x y #1: 1 Br

    0熱度

    1回答

    的給定元素創建褶皺我有一定數的數值向量: str(vector) int [1:15463] 389 1732 1737 2127 2205 3163 5166 5601 5981 6860 ... ,我想創建包含上述這些數字n摺疊。 當我嘗試與功能createFolds從caret包 flds <- createFolds(vector,10) 我只得到號碼範圍爲1至length(ve

    1熱度

    1回答

    似乎有是被調整模型時所產生的ROC /桑斯/規格之間的差異,通過對相同的數據集的模型進行的實際預測。我正在使用使用kernlab的ksvm的脫字符號。我沒有遇到glm的這個問題。 data(iris) library(caret) iris <- subset(iris,Species == "versicolor" | Species == "setosa") # we need only

    3熱度

    1回答

    我試圖開發一個簡單的應用程序,用於預測在給定某個年齡,班級,票價等的情況下乘客倖存泰坦尼克號的概率。我希望這些變量是動態的,並且希望使用底層脫字符模型計算預測的生存概率。 當運行這段代碼,我收到以下錯誤信息: Warning: Error in [.data.frame: undefined columns selected Stack trace (innermost first): 70: [

    1熱度

    1回答

    我運行一個預測在合適類似於是尖指南中找到: Caret Measuring Performance predictions <- predict(caretfit, testing, type = "prob") 但我得到的錯誤: Error in apply(x, 1, paste, collapse = ",") : dim(X) must have a positive length