2014-03-29 43 views
2

我想訓練一個有很多名義屬性的數據集。我從一些文章中注意到要轉換標稱屬性必須將它們轉換爲重複的二進制特性。另外據我所知,這樣做會在概念上使數據集稀疏。另外我知道scikit-learn使用稀疏矩陣和一些估計器,因爲它速度更快。但是我也發現一些估計者仍然不接受稀疏矩陣。我的問題是:到現在爲止哪些不接受稀疏矩陣?scikit-learn中哪些估計量不支持稀疏矩陣?

回答

3

您可以通過檢查文檔字符串來檢查scikit-learn中的方法是否支持稀疏矩陣。如果它說

X : {array-like, sparse matrix} 

然後支持稀疏矩陣輸入。當它只是說「類似數組」時,它們不被支持。