random-forest

    0熱度

    1回答

    我試圖解決輸入特徵集大小約爲54的迴歸問題。 對單個預測變量'X1'使用OLS線性迴歸,我無法解釋Y中的變化 - 因此我試圖使用迴歸森林(即隨機森林迴歸)來查找其他重要特徵。後來發現選定的'X1'是最重要的特徵。 我的數據集有〜14500個條目。我已經將它按比例9:1分成了訓練和測試集。 我有以下問題: 試圖找到重要的功能時,我應該運行在整個數據集的迴歸森林,或只在訓練數據? 一旦發現重要特徵,應

    -1熱度

    1回答

    我有一個射頻模型在R有六個預測器和一個響應。預測模型似乎很好,但我們也想爲這個模型生成一個響應曲面。 attach(al_mf) library(randomForest) set.seed(1) rfalloy=randomForest(Mf~.,data=al_mf,mtry=6,importance=TRUE) rfalloy rfpred=predict(rfalloy,al_m

    0熱度

    1回答

    我對隨機森林中樹的構建有個疑問。 我的樹結構的理解是這樣的: Suppose ----------- N (total records of data set) =1000 M (total features) =30 n (Subset) = 500 m (fixed features to be used in RF) = 3 First Tree ----------- 1

    0熱度

    2回答

    移動使用標準偏差平均值我想安裝使用RandomForestRegressor因爲我考慮this link import pandas as pd import math import matplotlib import matplotlib.pyplot as plt import numpy as np from sklearn.ensemble import RandomForest

    0熱度

    1回答

    我有一個類似於下面所示的數據集,在真實的情況下,行數會在10000到1000000之間。 會有更多的列,但是核心問題圍繞這兩個字段旋轉。 已知的標記 我知道類別-'Apple」, '藍莓', '橙', '生菜' 數據集 DataFrame ({'ROWID':1,2,3,4,5,6,7,8,9,10], 'Category':'Apple','Blueberry'.'Orange','Lett

    0熱度

    1回答

    我嘗試使用Python中隨機森林,乘坐火車和測試數據集建立的預測模型是初學者。 train [「ALLOW/BLOCK」]可以取4個期望值中的一個(所有字符串)。測試[「ALLOW/BLOCK」]是需要預測的。 y,_ = pd.factorize(train["ALLOW/BLOCK"]) y Out[293]: array([0, 1, 0, ..., 1, 0, 2], dtype=i

    0熱度

    1回答

    我試圖在R中實現一個簡單的隨機森林算法,以瞭解R和隨機森林如何工作,並測試測試集中的準確性。 我的樣本數據(561個總行的五行)是: bulbasaur[1:5,] Appt_date count no_of_reps PerReCount 1 2016-01-01 2 1 2.000000 2 2016-01-04 174 58 3.000000 3 2016-01-0

    2熱度

    1回答

    我正嘗試爲二項分類構建一個隨機森林分類器。有人可以解釋爲什麼我每次運行此程序時準確度得分都會有所變化分數在68% - 74%之間變化。此外,我嘗試調整參數,但我無法獲得超過74的準確度。對此的任何建議也將不勝感激。我嘗試使用GridSearchCV,但我只管理了一個體面的3點增加。 #import libraries import numpy as np import pandas as pd

    0熱度

    2回答

    根據我的理解,RF隨機選擇特徵,因此很難過度配合。但是,在sklearn中,漸變增強還提供了max_features選項,可以防止過度配合。那麼,爲什麼會有人使用隨機森林? 任何人都可以解釋什麼時候使用基於給定數據的漸變增強vs隨機森林? 任何幫助,高度讚賞。

    0熱度

    1回答

    我是新的火花,我想用它隨機森林分類器。 我使用libsvm格式的Iris數據來構建模型。 我的問題是 - 我怎樣才能將標籤作爲字符串? (在這種情況下 - 標籤是鳶尾花的類型)。 當數據轉換爲libsvm格式時,每個標籤都會得到一個代表它的整數,但我不知道如何返回到字符串標籤。 是否有可能與libsvm?或者我應該使用另一種格式? 這裏是我的代碼: public PipelineModel run