catboost

0熱度

2回答

我對隨機森林有疑問。想象一下，我有關於用戶與物品交互的數據。項目數量很大，大約爲10 000個。我的隨機森林輸出應該是用戶可能與之交互的項目（如推薦系統）。對於任何用戶，我想使用描述用戶過去已與之進行交互的項目的功能。但是，將分類產品功能映射爲單熱編碼看起來效率非常低，因爲用戶最多隻能與幾百個項目進行交互，有時甚至可能只有5個。您將如何去關於構建一個隨機森林時，其中一個輸入要素是一個具有〜100

0熱度

1回答

使用catboost進行排序任務

我想知道如何配置catboost進行排名任務。 catboost主頁暗示它可以用於排名任務。然而，似乎文檔排名的任務是稀缺： https://tech.yandex.com/catboost/doc/dg/concepts/cli-reference_train-model-docpage/ 和所有的教程都集中在個別情況進行分類： https://github.com/catboost/catbo

1熱度

2回答

如何使用`catboost`選擇nrounds？

如果我理解正確catboost，我們需要調整nrounds就像在xgboost，使用CV。我看到在official tutorial在文獻[8] params_with_od <- list(iterations = 500, loss_function = 'Logloss', train_dir = 'train_dir', od_t

0熱度

1回答

如何創建列描述（CD）文件Catboost

我聲明一個CD文件讀取它： pool = Pool(features_file, CDfile) 凡CDfile包含文本和< \ T>分隔符： 0 Target 1 Categ cat_reg 97 Categ cat_dow 98 Categ cat_nweek 99 Categ cat_month 100 Categ cat_hour 101 Categ cat_is_month_

0熱度

1回答

如何使用catboost overfitting檢測器

我想了解catboost過度檢測器。在此描述： https://tech.yandex.com/catboost/doc/dg/concepts/overfitting-detector-docpage/#overfitting-detector 另外一種梯度增強包，比如lightgbm和xgboost使用一個名爲early_stopping_rounds參數，這是很容易理解（它停止訓練，一旦驗證

1熱度

1回答

for cat平衡數據處理貓提高

是否有像catboost包中的「scale_pos_weight」參數，因爲我們曾經在python的xgboost包中有？

0熱度

1回答

Catboost是否支持單熱編碼？

我有一個熱點編碼的標籤。我想用它們來訓練和預測一個catboost分類器。然而，當我合適時，它給我一個錯誤，說標籤每行不允許有多個整數值。那麼catboost不允許對標籤進行單熱編碼？如果沒有，我怎樣才能讓catboost工作？

1熱度

1回答

在Windows上安裝CatBoost R包時出錯

我試圖在Windows上安裝CatBoost R包，但沒有成功。我已經通過了所有的指示和stackoverflow的帖子。我到目前爲止管理的是安裝python以及VC++組件。我可以編譯軟件包，但是在安裝時出現錯誤「TypeError：resolve_system_cxx（）需要正好4個參數（給出3）」。我正在通過CatBoost存儲庫進行搜索，但無法識別該函數的源文件。你能進一步幫助我嗎？

3熱度

1回答

IPython的導入錯誤：無法導入名稱佈局

我基於this article 試圖CatBoost在它的代碼，CatBoost在model.fit()plot，所以我想嘗試一下我的IPython。這裏是我的CatBoost代碼： from catboost import CatBoostRegressor # indicate categorical features for CatBoost categorical_features

2熱度

1回答

使用之前訓練過的模型在catboost中進一步預測

我想找到使用Catboost進行分類的最佳參數。我有訓練數據和測試數據。我想運行500次迭代的算法，然後對測試數據進行預測。接下來，我想重複600次迭代，然後700次迭代，等等。我不想從第0次迭代開始。那麼，有沒有什麼辦法可以在Catboost算法中做到這一點？任何幫助，高度讚賞！