2017-10-20 108 views
0

我正在使用R執行我的分析,我將執行四種算法。分類任務中的所有二元預測變量

1. RF 
2. Log Reg 
3. SVM 
4. LDA 

我有50個預測變量和1個目標變量。我所有的預測變量和目標變量都只有二進制數字0和1。

我有以下問題:

Should I convert them all into factors? 
Converting them into factors, and applying RF algorithms give 100% accuracy, I am very much surprised to see that as well. 
Also, for other algorithms, how should i treat my variables priorly, before feeding them into my other algorithms. 

感謝

+0

https://stats.stackexchange.com/a/112052/1569 –

+0

@HongOoi,即使在測試數據。 – Shivam

回答

2

如果變量/預測是明確的,那麼最好是將它們轉換爲因素。否則,它很可能會被視爲數值。

如果您正在執行分類任務,那麼最好也將目標/響應變量作爲一個因子。

最好還是看看你使用的函數的文檔,以確保它們不會將因子轉換爲數值。

+0

我已經將它們轉換成了因素,我不認爲,您的答案達到了標準,並且它應該有一個評論。 – Shivam

+0

爲什麼它不符合標準?你的問題顯然是「我應該將它們全部轉化爲因素嗎?」 – tpol

+0

如果你不喜歡我的答案,就讓它成爲。看起來你會尋求幫助,然後期望給出一些讓你滿意的答案。 – tpol

相關問題