我想對我的數據集中的10個特徵中的3個分類特徵進行編碼。我使用sklearn.preprocessingpreprocessing
如下面這樣做:OneHotEncoder對分類特徵的問題
from sklearn import preprocessing
cat_features = ['color', 'director_name', 'actor_2_name']
enc = preprocessing.OneHotEncoder(categorical_features=cat_features)
enc.fit(dataset.values)
但是,我無法繼續,因爲我得到這個錯誤:
array = np.array(array, dtype=dtype, order=order, copy=copy)
ValueError: could not convert string to float: PG
我很奇怪爲什麼它抱怨串因爲它應該轉換它!我在這裏錯過了什麼嗎?
非常感謝。 – Medo