random-forest

3熱度

1回答

如何設計實時交易數據的體系結構以將其分類爲欺詐？隨機森林分類器ML模型是使用歷史數據使用Scala和Spark MLLib開發，訓練和測試的，並且持續存在。實時交易數據正在使用來自一個主題的Apache Kafka，Spark Streaming處理並寫入另一個主題以便通過分類器ML模型進行預測。我的擔心：我如何提供並獲得預測當前交易數據從Kafka主題收到使用上述ML模式？預測在線當前

0熱度

1回答

與RandomForest GridsearchCV

所以我正在做RandomForest和GridsearchCV一些參數的事情。這是我的代碼。 #Import 'GridSearchCV' and 'make_scorer' from sklearn.model_selection import GridSearchCV from sklearn.metrics import make_scorer Create the paramete

0熱度

1回答

如何處理測試數據不在列車數據

我一直在開發利用隨機Forest.My訓練數據集模型有15列附加列可以說A到O的模型使用上述功能訓練。假設測試集的特徵或列數也是相同的，但是現在客戶端添加了很少的列，且模型未能預測新數據。它適用於迴歸和分類問題。有什麼辦法/機制來處理或避免什麼，除了在火車可新增加的列？我們是否需要顯式編寫代碼或者可以使用任何參數/內置函數來處理這種情況。感謝你的幫助。謝謝！

5熱度

1回答

RcppShark隨機森林例如拋出關於隨機數發生器例外

我跟着這個例子： https://www.2021.ai/randsharkmachinelearning/ 運行在讀該命令時： sharkFit <- SharkRFTrain(X, Y, nTrees = 100) 我得到： Error in SharkRFTrain(X, Y, nTrees = 100) : Should not call this. Fix the rand

0熱度

1回答

GBM和射頻ensamble在插入

我目前正試圖建立一個堆疊模型使用caretEnsemble包，使用隨機森林和廣義推動模型作爲基礎模型。不過，我一直在運行caretEnsemble功能後，收到以下錯誤： Error in check_caretList_model_types(list_of_models) : Not yet implemented for multiclass problems 已經完成對這個問題的一些研

1熱度

2回答

Python：我們如何匹配迴歸模型的預測值和真值的值

我們試圖在擬合模型以預測真值之後在同一圖上繪製預測值和真值，其中使用Python中的RandomForestRegressorthree column dataset（點擊鏈接下載完整CSV -dataset格式化爲以下 t_stamp,X,Y 0.000543,0,10 0.000575,0,10 0.041324,1,10 0.041331,2,10 0.041336,3,10 0

1熱度

2回答

人工增加隨機森林和神經網絡的迴歸訓練數據

我們試圖根據它們的屬性值來預測銷售量。我們有大約8000條訓練數據記錄。通過添加小的變化來增加訓練數據是正確的相同8000條記錄的銷售數量？我想準備帶有24000（3 * 8000）個記錄的新訓練集，銷售數量爲+或對於那些8000記錄爲-0.1 例如：與原始數據銷售數量= 2一樣，新數據將具有2,2.1和1.9爲同一項目。

2熱度

1回答

在H2O隨機森林和xgboost中使用權重列

我試圖在二元分類問題（誤報成本很高）中最大化精度。數據集也是非常不平衡的。爲了防止誤報，第二次使用權重列兩次運行DRF或XGBOOST模型是否有意義？除了這種潛在的方法，在這些H2O算法中還有其他方法可以最大化精度（而不是對數損失）嗎？我也將使用一個合奏（這似乎增加了精度）。交叉驗證似乎沒有幫助。

2熱度

1回答

如何計算遊俠RF模型的AUC值？

我如何計算護林模型AUC值？遊俠是R的快速實現隨機森林算法我使用下面的代碼來構建分類目的遊俠模型，從模型得到的預測： #Build the model using ranger() function ranger.model <- ranger(formula, data = data_train, importance = 'impurity', write.forest = TRUE, n

0熱度

1回答

使用.pkl文件中的export_graphviz可視化模型

我已將模型導出到.pkl文件中。現在我試圖通過Joblib進口，其格式爲sklearn.model_selection._search.GridSearchCV。但是我無法使用從sklearn.tree導入export_graphvizexport_graphviz，因爲它預期tree_作爲第一個參數。有沒有辦法做到這一點？這裏是我的代碼： export_graphviz(model,out_