我有以下陣列(實際上是一個熊貓數據幀,其具有的陣列狀的數據結構),它類似於以下內容:如何在scikit中對分類數據使用一個熱門編碼器?
[
['M', 4, 15]
['M', 3, 7]
['F', 5, 9]
['I', 4, 15]
]
我要預處理該數據,所以我可以在直線用它迴歸。 我相信這樣做的方法是使用一個熱編碼器:http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html#sklearn.preprocessing.OneHotEncoder。
但是,只有類別是整數纔有效。
我相信你可以使用DictVectorizer
做到這一點:http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.DictVectorizer.html#sklearn.feature_extraction.DictVectorizer
然而,這似乎只爲字典,而不是數組。