2017-04-12 19 views
-3

![Kidney Disease after doing a PCA] 1綠點是否可分?

我有一個數據集,我想要預測病人得了這種病。下圖是第一步之後:

  1. 縮放3個功能
  2. 運行scikit學習的PCA常規
  3. 原始數據集有25個功能,但對於我們的工作,我們被要求只能使用3特點。這3個功能然後減少到2通過PCA

當我看這個數據,我的第一個反應是,綠點(那些不容易腎病)不可分離。

我的假設是否正確?

+0

謝謝..... !!多數民衆贊成我也think太 –

回答

1

可能是您的PCA不會產生分離您的數據的最佳功能。我會建議使用像Random Forest或XGBoost這樣的功能,您可以輕鬆查看功能重要性,然後使用最佳3個功能嘗試對數據進行分類。

+0

Xgboost已變得如此重要和廣泛使用。好的建議。 – duffymo

+0

謝謝你。我會盡力的! –

0

這是不可能分開的點。