gbm

    0熱度

    2回答

    我有超過400個功能的數據集,我用GBM使用H2O atop R進行估算。當我使用變量重要性函數(h2o.varimp)時,它只顯示我的頭部和尾部完整的排名變量列表。有沒有辦法讓整個列表顯示?

    1熱度

    1回答

    我是新來的蘇打水和機器學習從蘇打水的GBM算法的結果, 我已經建立了GBM模型用兩個數據集手動分爲訓練和測試。 任務是使用所有數字屬性進行分類的(響應列轉換爲枚舉類型)。代碼在Scala中。建立個人樹木預測之前,列車數據之一,一個測試數據 - val gbmParams = new GBMParameters() gbmParams._train = train gbmPara

    0熱度

    1回答

    當我嘗試添加水火花和使用GBM模型。包裝它時我收到了這個異常。這是我第一次用火花來運行H2O。我只是嘗試在我的火花應用中添加H2O庫並在H2O中使用GBM。

    1熱度

    1回答

    我使用H2O 3.10.4.1 我試圖用一些初步的預測從其他模式以適應GBM伯努利模型和我比開始預測越來越差可能性。我能夠使用泰坦尼克號數據重現它。 我能夠使用R的gbm來做我想做的事。 R的gbm.fit要求在鏈路規模上有所偏移,該規模不受限制,可能是非常高或非常低的負值。 然而,當我嘗試做相同的H2O GBM,它拋出一個錯誤:GBM模型參數非法(S): water.exceptions.H2O

    0熱度

    1回答

    我想在我的三維依賴圖中添加顏色漸變色,後面是擬合值(例如較高的擬合值較暗的顏色,較低的擬合值較淺的顏色)。 我已經使用在dismo套餐贈送的例子: library(dismo) data(Anguilla_train) angaus.tc5.lr01 <- gbm.step(data=Anguilla_train, gbm.x = 3:13, gbm.y = 2, family = "ber

    1熱度

    1回答

    我正在使用h2o構建gbm模型。培訓數據隨機分爲70%的開發數據和30%的及時驗證數據。訓練數據有1.4%的不良率,我還需要爲每個觀察分配權重(數據有一個權重欄)。觀察結果是:與無重量建模的模型(VAL)相比,使用重量建立的模型在開發數據(DEV)上具有更高的性能。使用重量建模的模型在開發和實時驗證數據之間有很大的性能差異。例如,模型建立與重示出了以下前10%的捕獲率 DEV:56% 驗證:25%

    0熱度

    1回答

    當我使用count:poisson而不是rmse時,我看到的值爲nloglikelihood。現在我不確定如何將這些數字與rmse或mae進行比較。 肯定會更好的價值..但沒有得到實際的錯誤直覺,我們與rmse或湄獲得。 例如 - >train-poisson-nloglik:2.01885 val-poisson-nloglik:2.02898 在這裏,我們可以說,實際值由2.02錯誤不同。 有

    0熱度

    1回答

    減少錯誤我想知道ErrorReduction是如何在pretty.gbm.tree函數計算:https://github.com/gbm-developers/gbm3/blob/62c8dafd87b16fe1d2079cdd5058169f1f08967b/R/pretty-gbm-tree.r#L32 這篇文章對我幫助很大,但並沒有完全回答我的問題。 Understanding tree s

    1熱度

    1回答

    我用gbm函數來實現梯度增強。我想分類。 之後,我使用varImp()函數在梯度增強建模中打印變量重要性。 但是......只有4個變量具有非零重要性。我的大數據中有371個變量......是不是? 這是我的代碼和結果。 >asd<-read.csv("bigdatafile.csv",header=TRUE) >asd1<-gbm(TARGET~.,n.trees=50,distributio

    1熱度

    1回答

    我使用gbm()函數來創建模型,我想要得到精度。以下是我的代碼: df<-read.csv("http://freakonometrics.free.fr/german_credit.csv", header=TRUE) str(df) F=c(1,2,4,5,7,8,9,10,11,12,13,15,16,17,18,19,20,21) for(i in F) df[,i]=as.fa