random-forest

    3熱度

    1回答

    如何設計實時交易數據的體系結構以將其分類爲欺詐? 隨機森林分類器ML模型是使用歷史數據使用Scala和Spark MLLib開發,訓練和測試的,並且持續存在。 實時交易數據正在使用來自一個主題的Apache Kafka,Spark Streaming處理並寫入另一個主題以便通過分類器ML模型進行預測。 我的擔心: 我如何提供並獲得預測當前交易數據從Kafka主題收到使用上述ML模式? 預測在線當前

    0熱度

    1回答

    所以我正在做RandomForest和GridsearchCV一些參數的事情。這是我的代碼。 #Import 'GridSearchCV' and 'make_scorer' from sklearn.model_selection import GridSearchCV from sklearn.metrics import make_scorer Create the paramete

    0熱度

    1回答

    我一直在開發利用隨機Forest.My訓練數據集模型有15列附加列可以說A到O的模型使用上述功能訓練。假設測試集的特徵或列數也是相同的,但是現在客戶端添加了很少的列,且模型未能預測新數據。它適用於迴歸和分類問題。 有什麼辦法/機制來處理或避免什麼,除了在火車可新增加的列?我們是否需要顯式編寫代碼或者可以使用任何參數/內置函數來處理這種情況。感謝你的幫助。謝謝 !

    5熱度

    1回答

    我跟着這個例子: https://www.2021.ai/randsharkmachinelearning/ 運行在讀該命令時: sharkFit <- SharkRFTrain(X, Y, nTrees = 100) 我得到: Error in SharkRFTrain(X, Y, nTrees = 100) : Should not call this. Fix the rand

    0熱度

    1回答

    我目前正試圖建立一個堆疊模型使用caretEnsemble包,使用隨機森林和廣義推動模型作爲基礎模型。不過,我一直在運行caretEnsemble功能後,收到以下錯誤: Error in check_caretList_model_types(list_of_models) : Not yet implemented for multiclass problems 已經完成對這個問題的一些研

    1熱度

    2回答

    我們試圖在擬合模型以預測真值之後在同一圖上繪製預測值和真值,其中使用Python中的RandomForestRegressorthree column dataset(點擊鏈接下載完整CSV -dataset格式化爲以下 t_stamp,X,Y 0.000543,0,10 0.000575,0,10 0.041324,1,10 0.041331,2,10 0.041336,3,10 0

    1熱度

    2回答

    我們試圖根據它們的屬性值來預測銷售量。我們有大約8000條訓練數據記錄。通過添加小的變化來增加訓練數據是正確的相同8000條記錄的銷售數量? 我想準備帶有24000(3 * 8000)個記錄的新訓練集,銷售數量爲+或對於那些8000記錄爲-0.1 例如:與原始數據銷售數量= 2一樣,新數據將具有2,2.1和1.9爲同一項目。

    2熱度

    1回答

    我試圖在二元分類問題(誤報成本很高)中最大化精度。數據集也是非常不平衡的。爲了防止誤報,第二次使用權重列兩次運行DRF或XGBOOST模型是否有意義? 除了這種潛在的方法,在這些H2O算法中還有其他方法可以最大化精度(而不是對數損失)嗎?我也將使用一個合奏(這似乎增加了精度)。交叉驗證似乎沒有幫助。

    2熱度

    1回答

    我如何計算護林模型AUC值?遊俠是R的快速實現隨機森林算法我使用下面的代碼來構建分類目的遊俠模型,從模型得到的預測: #Build the model using ranger() function ranger.model <- ranger(formula, data = data_train, importance = 'impurity', write.forest = TRUE, n

    0熱度

    1回答

    我已將模型導出到.pkl文件中。現在我試圖通過Joblib進口,其格式爲sklearn.model_selection._search.GridSearchCV。 但是我無法使用從sklearn.tree導入export_graphvizexport_graphviz,因爲它預期tree_作爲第一個參數。 有沒有辦法做到這一點?這裏是我的代碼: export_graphviz(model,out_