xgboost

    1熱度

    2回答

    我目前正在研究一個旨在預測二進制類的機器學習項目(負數:0,正數:1)。數據集不平衡。正值比例爲0.1%。 我正在使用gini作爲我的性能指標運行xgboost模型。 問題是,升壓迭代期間,它需要大量的奔跑不斷提高得分 例: [Fold 1/2] [0] train-gini:-0.048192 validation-gini:-0.042979 Multiple eval metrics h

    1熱度

    2回答

    我想補充說這個問題 - is multi-cpu supported by h2o-xgboost? - 但顯然我的代表太低。 我正在使用h2o(3.14.06)的最新穩定版本。 爲了試圖解決這個問題,我已經確信,GCC是我的搬運工圖像中建立(使用apt-get安裝GCC) dpkg -l | grep gcc gcc 4:5.3.1-1ubuntu1 amd64 GNU C c

    3熱度

    1回答

    我已經搜索了sklearn docs for TimeSeriesSplit和docs for cross-validation,但我一直未能找到一個工作示例。 我正在使用sklearn版本0.19。 這是我的設置 import xgboost as xgb from sklearn.model_selection import TimeSeriesSplit from sklearn.gri

    0熱度

    1回答

    我目前正在關注以下link的幻燈片。我在幻燈片121/128上,我想知道如何複製AUC。作者沒有解釋如何這樣做(幻燈片124中也一樣)。其次,在幻燈片125上生成以下代碼; bestRound = which.max(as.matrix(cv.res)[,3]-as.matrix(cv.res)[,4]) bestRound 我收到以下錯誤; 錯誤as.matrix(cv.res),2]:下

    0熱度

    1回答

    我在python中創建了XGBoost分類器。我試圖做GridSearch找到這樣 grid_search = GridSearchCV(model, param_grid, scoring="neg_log_loss", n_jobs=-1, cv=kfold) grid_result = grid_search.fit(X, Y) print("Best: %f using %s" %

    0熱度

    1回答

    有人可以幫我解決以下問題:我需要將我的xgboost訓練模型與插入符號包一起更改爲未知錯誤度量RMSLE。默認情況下,caret和xgboost訓練和測量RMSE。 這裏是行代碼: 在插入符格式 custom_summary = function(data, lev = NULL, model = NULL){ out = rmsle(data[, "obs"], data[, "pred"])

    1熱度

    1回答

    我在ubuntu上使用python 3.6.2上的Anaconda,並使用「pip install xgboost」安裝xgboost,也從here(將pythonpath設置爲庫),但兩者不能工作,總是顯示 「 'module' object has no attribute 'XGBClassifier' 」 下面是我的代碼: cv_params = {'max_depth': [3,5,7]

    1熱度

    1回答

    在下面的代碼中,我嘗試搜索xgboost的不同超參數。 param_test1 = { 'max_depth':list(range(3,10,2)), 'min_child_weight':list(range(1,6,2)) } predictors = [x for x in train_data.columns if x not in ['target', 'id']] gsea

    0熱度

    1回答

    試圖實現XGBoost來確定最重要的變量,我有一些數組的錯誤。 我的完整代碼如下 from numpy import loadtxt from numpy import sort import pandas as pd from xgboost import XGBClassifier from sklearn.model_selection import train_test_split

    2熱度

    3回答

    經常利益相關者不希望有一個很好的預測黑箱模型;他們希望瞭解有關功能的深入瞭解,以便他們能夠向其他人解釋。 當我們檢查xgboost或sklearn漸變增強模型的特徵重要性時,我們可以確定特徵的重要性......但我們不明白爲什麼這些特徵很重要,是嗎? 有沒有辦法解釋不僅是什麼功能重要,而且爲什麼它們很重要? 我被告知使用shap但即使運行一些樣板實例拋出錯誤,所以我在尋找替代品(或者甚至只是一個程