我正在使用R執行我的分析,我將執行四種算法。 1. RF
2. Log Reg
3. SVM
4. LDA
我有50個預測變量和1個目標變量。我所有的預測變量和目標變量都只有二進制數字0和1。 我有以下問題: Should I convert them all into factors?
Converting them into factors, and applying RF alg
對於下面的代碼,我的r平方分數出來爲負,但我的精度分數使用K-雙倍交叉驗證即將達到92%。這可能怎麼樣?我使用隨機森林迴歸算法來預測一些數據。該數據集的鏈接在下面的鏈接中給出: https://www.kaggle.com/ludobenistant/hr-analytics import numpy as np
import pandas as pd
from sklearn.preproc
是否有一種使用GridSearch自動調整隨機森林分類器的方法。我們沒有提供這些值,而是有任何方法可以找到最佳的最佳參數值。 rfc = RandomForestClassifier(n_jobs=-1, max_features='sqrt', oob_score = True)
# Use a grid over parameters of interest
param_