catboost

    0熱度

    2回答

    我對隨機森林有疑問。想象一下,我有關於用戶與物品交互的數據。項目數量很大,大約爲10 000個。我的隨機森林輸出應該是用戶可能與之交互的項目(如推薦系統)。對於任何用戶,我想使用描述用戶過去已與之進行交互的項目的功能。但是,將分類產品功能映射爲單熱編碼看起來效率非常低,因爲用戶最多隻能與幾百個項目進行交互,有時甚至可能只有5個。 您將如何去關於構建一個隨機森林時,其中一個輸入要素是一個具有〜100

    0熱度

    1回答

    我想知道如何配置catboost進行排名任務。 catboost主頁暗示它可以用於排名任務。然而,似乎文檔排名的任務是稀缺: https://tech.yandex.com/catboost/doc/dg/concepts/cli-reference_train-model-docpage/ 和所有的教程都集中在個別情況進行分類: https://github.com/catboost/catbo

    1熱度

    2回答

    如果我理解正確catboost,我們需要調整nrounds就像在xgboost,使用CV。我看到在official tutorial在文獻[8] params_with_od <- list(iterations = 500, loss_function = 'Logloss', train_dir = 'train_dir', od_t

    0熱度

    1回答

    我聲明一個CD文件讀取它: pool = Pool(features_file, CDfile) 凡CDfile包含文本和< \ T>分隔符: 0 Target 1 Categ cat_reg 97 Categ cat_dow 98 Categ cat_nweek 99 Categ cat_month 100 Categ cat_hour 101 Categ cat_is_month_

    0熱度

    1回答

    我想了解catboost過度檢測器。在此描述: https://tech.yandex.com/catboost/doc/dg/concepts/overfitting-detector-docpage/#overfitting-detector 另外一種梯度增強包,比如lightgbm和xgboost使用一個名爲early_stopping_rounds參數,這是很容易理解(它停止訓練,一旦驗證

    1熱度

    1回答

    是否有像catboost包中的「scale_pos_weight」參數,因爲我們曾經在python的xgboost包中有?

    0熱度

    1回答

    我有一個熱點編碼的標籤。我想用它們來訓練和預測一個catboost分類器。然而,當我合適時,它給我一個錯誤,說標籤每行不允許有多個整數值。那麼catboost不允許對標籤進行單熱編碼?如果沒有,我怎樣才能讓catboost工作?

    1熱度

    1回答

    我試圖在Windows上安裝CatBoost R包,但沒有成功。我已經通過了所有的指示和stackoverflow的帖子。 我到目前爲止管理的是安裝python以及VC++組件。 我可以編譯軟件包,但是在安裝時出現錯誤「TypeError:resolve_system_cxx()需要正好4個參數(給出3)」。我正在通過CatBoost存儲庫進行搜索,但無法識別該函數的源文件。你能進一步幫助我嗎?

    3熱度

    1回答

    我基於this article 試圖CatBoost在它的代碼,CatBoost在model.fit()plot,所以我想嘗試一下我的IPython。 這裏是我的CatBoost代碼: from catboost import CatBoostRegressor # indicate categorical features for CatBoost categorical_features

    2熱度

    1回答

    我想找到使用Catboost進行分類的最佳參數。 我有訓練數據和測試數據。我想運行500次迭代的算法,然後對測試數據進行預測。接下來,我想重複600次迭代,然後700次迭代,等等。我不想從第0次迭代開始。那麼,有沒有什麼辦法可以在Catboost算法中做到這一點? 任何幫助,高度讚賞!