gbm

    3熱度

    1回答

    我天真地認爲直接在一個foreach循環內並行地調用h2o.gbm是很簡單的。但有一個奇怪的錯誤。 Error in { : task 3 failed - "java.lang.AssertionError: Can't unlock: Not locked!" 代碼下 library(foreach) library(doParallel) library(doSNOW)

    0熱度

    1回答

    我使用GradientBoosting分類器來預測用戶的性別。數據有很多預測因素,其中之一就是國家。對於每個國家我都有二元列。對於所有國家/地區欄,始終只有一列設置爲1。但從計算的角度來看,這樣的desicion非常慢。有沒有什麼方法只用一列代表國家列?我的意思是正確的。

    0熱度

    1回答

    我對預測有多好一個NBA球員將在其接下來的比賽中發揮的基礎上,他們是如何以及在本賽季的所有以前的遊戲進行籃球模式工作。每個NBA球隊大概有10名球員,而且本賽季30支球隊每場都打了25場比賽,所以我的數據框在這一點上大概有10 * 30 * 25 = 7,500的觀測值。我每天運行我的模型,預測玩家在第二天的表現會如何 - 因此,對於明天我會做大約10 * 30 = 300的預測。 我的問題是這樣

    1熱度

    1回答

    我在r中使用gbm來預測生存(distribution =「coxph」)。 gbm.predict(....,type =「response」)的預測值大概在[-0.001至0.5]之間。 如何解釋新樣本的風險範圍爲0到1([0,1])。

    3熱度

    2回答

    我無法更改gbm模型的部分圖上的x和y標籤。我需要將它們重新命名爲期刊文章。 我在閱讀本並創建情節如下: library(gbm) final<- readRDS(final_gbm_model) summary(final, n.trees=final$n.trees) 以下是總結輸出: var rel.inf ProbMn50ppb Pro

    1熱度

    1回答

    我在插入符號上使用GBM的這兩個派生詞。 我在同一個數據集上嘗試了兩種算法,它們返回不同的準確度並在不同的時間執行。通過名稱,我可以認爲第一個在某處使用線性函數,而另一個使用樹。 無論如何,我不明白它在哪裏使用線性而不是樹。 我知道GBM算法使用樹作爲預測器,可以說第一種情況下使用不同的結構像訓練? 我在哪裏可以找到關於此主題的一些文檔? 感謝

    0熱度

    1回答

    我使用visreg包和visreg2d()函數來創建顯示兩個gbm模型變量之間相互作用的3D部分依賴關係圖。我需要更改x,y和z軸標籤以及間距,以便爲期刊文章製作精美的圖。我嘗試更改par()中的設置,但這隻允許我更改標籤大小。 我生成具有以下情節: visreg2d(final,n.trees=1000,xvar="ProbMn50ppb",yvar="DTW60Jurgens",plot.ty

    0熱度

    1回答

    我試圖根據定性調查數據的工作產生分類模型。我們對大約10K名客戶進行了研究,並因此建立了細分模型,隨後將每個客戶分爲8個客戶羣中的1個。現在的挑戰是如何將TOTAL客戶羣分爲這些細分市場。由於只有某些客戶迴應,研究人員使用總體人口統計來應用分層後權重(或頻率權重)。 我的任務是現在使用我們的客戶數據作爲這個10K的解釋變量,以便爲整個基地建立一個分類模型。 爲了處理客戶的重量,我簡單地將每個客戶記

    0熱度

    1回答

    我需要進行分析,我們需要將GBM算法應用於一系列自舉複製。另一個缺點是每個重複都需要分位標準化結果。 我試圖最終實現的是 1.從 開始主數據集2.創建一個包含200個重採樣的3維陣列 3.分位數在每個重採樣內標準化結果變量 4.全部運行GBM樣本 現在,我甚至無法進入重採樣步驟。 #generating some data main<-matrix( replicate(52,rnor

    0熱度

    2回答

    我試圖限制部分依賴關係圖的x軸(以便有效區域得到放大)。我嘗試過使用xlim選項,但沒有奏效。 我創建了一個簡單的例子來重現問題: library(gbm) xdata <- iris # reformulate problem as binary classification xdata$Species <- as.character(xdata$Species) change.cl