xgboost

    2熱度

    2回答

    我正在接觸所有的SO C++天才。 我訓練(和測試成功)在python的xgboost模型,像這樣: dtrain =xgb.DMatrix(np.asmatrix(X_train),label=np.asarray(y_train,dtype=np.int), feature_names=feat_names) optimal_model = xgb.train(plst, dtrain)

    4熱度

    1回答

    我無法弄清楚如何將目標函數'multi:softmax'傳遞給xgb.XGBClassifier的類或eval度量的數量。 我看了很多文檔,但只談論了接受n_class/num_class的sklearn包裝。 我目前的設置是這樣 kf = cross_validation.KFold(y_data.shape[0], \ n_folds=10, shuffle=True, random

    1熱度

    1回答

    每次我使用xgboost(不僅僅是python)時,訓練信息總是在每行上包含「0個修剪節點」。例如: import pandas as pd from sklearn import datasets import xgboost as xgb iris = datasets.load_iris() dtrain = xgb.DMatrix(iris.data, label = iris.t

    7熱度

    1回答

    我想在使用脫字符時並行化xgboost的模型擬合過程。根據我在xgboost的documentation中看到的,nthread參數控制擬合模型時要使用的線程數,這意味着以並行方式構建樹。 Caret的train函數將執行並行化,例如,針對k倍CV中的每次迭代運行一個進程。這種認識是正確的,如果是,是它更好地: 註冊核的數量(例如,與doMC包和registerDoMC功能),通過插入符號的火車功

    5熱度

    1回答

    是否可以在Xgboost中訓練具有多個連續輸出(多回歸)的模型? 訓練這樣一個模型的目標是什麼? 在此先感謝您的任何建議

    2熱度

    1回答

    我遇到了一些違揹我理解的事情。我的理解是,對於活動對象,'this'不能爲空,但是,對於下面顯示的情況,我正在遇到類似的情況。 上下文 - 我在這種情況下使用XGBoost4J-Spark包。你可以看看源代碼here。更具體地說,我指的是XGBoostEstimator類。我有這個類的下面的定義,只有一個附加的打印語句。 package ml.dmlc.xgboost4j.scala.spark

    3熱度

    2回答

    只是想知道是如何可能的未來情況後,差異訓練和測試功能: def fit(self, train, target): xgtrain = xgb.DMatrix(train, label=target, missing=np.nan) self.model = xgb.train(self.params, xgtrain, self.num_rounds) 我通過訓練集爲cs

    0熱度

    2回答

    我一直在努力與xgboost安裝,我做了很多事情,但我可以看到this可能工作。我下載的文件xgboost.rar,然後提取成庫/網站套餐 現在,當我打開我的網站打包它顯示xgboost但是當我import xgboost它說no module named xgboost。 請請幫助

    0熱度

    1回答

    我有一個libsvm格式的數據集,其中包含重要性分數和特徵的標籤。 qid是查詢。數據如下所示。 我想使用xgboost進行搜索排名,但我不知道xgb.train函數的輸入數據格式是什麼。我已經看到了用於分類和迴歸的數據格式。但是我的數據集具有代表組信息的查詢並且lambda尚未計算。那麼,如何使用xgboost api來訓練我的等級模型,以及需要什麼樣的數據格式呢? 此外,我想用ndcg來評估我

    1熱度

    1回答

    最近,當我嘗試使用xgboost的CLI版本來預測輸入時,我發現它的結果與python版本有很大不同。 與Python,我預測它是這樣的: data = xgb.DMatrix(X) bst = xgb.Booster() bst.load_model(modelfile) leafindex = bst.predict(data, pred_leaf=False) 並如下使用CLI: